מרכזי נתונים נשענים על סיבים אופטיים לתקשורת החיצונית, אך החיבור הפנימי בין הרכיבים הוא באמצעות כבלי חשמל מנחושת, ושבבי ה-GPU ממתינים לנתונים במשך חצי מהזמן. מחקר של IBM מצא שניתן לחברם באמצעות התקן אופטי שיאיץ את התקשורת ביניהם פי 80, וגם יחסוך משמעותית בהוצאות האנרגיה
IBM חשפה פריצת דרך מחקרית בטכנולוגיות אופטיקה שהדגימה דרך להעביר נתונים במהירות האור בתוך מרכזי נתונים. המחקר יוכל לשפר באופן דרמטי את האופן שבו מרכזי נתונים מאמנים ומריצים מודלי בינה מלאכותית.
כיום, סיבים אופטיים מעברים נתונים במהירויות גבוהות למרחקים ארוכים, והטכנולוגיה הנפוצה הזו אחראית כמעט לכל תעבורת הנתונים בעולם. גם מרכזי נתונים משתמשים בסיבים אופטיים, אך רק עבור רשתות התקשורת החיצוניות שלהם. התקשורת הפנימית, בתוך ארונות השרתים וביניהם, מבוססת על כבלים חשמליים מנחושת המחברים בין שבבי ה-GPU והרכיבים הנוספים. כתוצאה מכך עלולים אותם שבבי GPU להימצא בחוסר שימוש (מצב סרק) יותר ממחצית מהזמן, כשהם ממתינים לזרמי הנתונים מהרכיבים האחרים. כשמדובר בתהליך אימון מודלים רחב המתפרס על פני מספר גדול של רכיבים ומערכות, המשמעות היא חוסר יעילות והוצאות אנרגיה גדולות.
כעת, חוקרי IBM הציגו אב טיפוס של התקן אופטי שיכול לאפשר קישוריות אופטית בתוך מרכזי נתונים במהירות האור, לצד התקשורת ה"חוטית" הקיימת בטווח הקצר. טכנולוגיה זו עשויה להגדיל באופן משמעותי את רוחב הפס של התקשורת בתוך מרכזי הנתונים, ולצמצם את זמן "ההשבתה" של שבבי ה-GPU תוך ניצולם באופן מיטיבי למשימות עיבוד נתונים.
במאמר שפרסמו חוקרי IBM הם התייחסו לכך שבשנים האחרונות, הודות להתקדמות הרבה בתחום פיתוח השבבים, התאפשר לדחוס טרנזיסטורים רבים על גבי השבב. כך למשל, טכנולוגיית שבבי ה-2 ננומטר של IBM הצליחה לדחוס יותר מ-50 מיליארד טרנזיסטורים על גבי שבב יחיד. המאמר של החוקרים מסביר כיצד לאותם התקנים אופטיים חדשניים, יחד עם שידור נתונים באורכי גל מרובים בכל ערוץ אופטי, יש פוטנציאל להרחיב את רוחב הפס בין שבבים פי 80 בהשוואה לחיבורים חשמליים.
לדברי החוקרים, הטכנולוגיה החדשה תוכל לאפשר למפתחים לאמן מודלי שפה גדולים (LLMs) במהירות גבוהה פי 5 לעומת שימוש בכבלי חשמל, ולהפחית את משך הזמן שנדרש לאימון מודל סטנדרטי משלושה חדשים לשלושה שבועות לערך. ניתן גם יהיה להציג חיסכון של פי 5 בכמות האנרגיה הנדרשת לעומת הכמות הנדרשת בשימוש בכבלי חשמל ואף להאריך את חיבורי התקשורת הפנימיים במרכזי הנתונים ממטר אחד ל-100 מטר. החיסכון הכולל באנרגיה נאמד כשווה ערך לצריכת החשמל של 5000 בתים בארה"ב במשך שנה שלמה עבור כל תהליך אימון של מודל AI.
החוקרים מתארים כיצד פריצת הדרך החדשה הזו תגדיר מחדש את האופן שבו תעשיית המחשוב תעביר נתונים ברוחב פס גבוה בין שבבים, מערכות ושרתים. החידוש גם יאפשר ליצרניות השבבים להוסיף פי שישה יותר סיבים אופטיים בקצה של חיבור פוטוני בהשוואה לטכנולוגיה האופטית המתקדמת הנוכחית. כל סיב, שעוביו בערך פי שלושה מעובי של שערה אנושית, יוכל להשתרע לאורך של סנטימטרים בודדים עד מאות מטרים, ולשדר טרה-ביט של נתונים בכל שנייה.
"מכיוון שבינה מלאכותית יוצרת דורשת יותר אנרגיה וכוח עיבוד, מרכז הנתונים חייב להתפתח", אמר דריו גיל, ראש חטיבת המחקר של IBM. "עם פריצת הדרך הזו, השבבים של המחר יתקשרו בדומה לאופן שבו סיבים אופטיים נושאים נתונים אל וממרכזי הנתונים, ויפתחו עידן חדש של תקשורת מהירה וחסכונית באנרגיה, שיכולה להתמודד עם עומסי העבודה של בינה מלאכותית עתידית".