זה היה קצת כמו ב"מנהרת הזמן" של טוני ודאג. מצאנו את עצמנו במנהרה, הסתחררנו, ונחתנו בזמן אחר. לטובת הצעירים שבינינו, שלא ראו את סדרת הטלוויזיה האייקונית, אסביר שמדובר בסדרת מדע בדיוני. גיבורי הסדרה, המדענים טוני ודאג, עברו בכל פרק לזמן אחר בהיסטוריה, באמצעות מנהרת הזמן.
בסוף 2022, היה רגע כזה שנראה היה שכולנו, קצת כמו גיבורי הסדרה, מצאנו את עצמנו (בשמחה או בעל כורחנו) בתוך מנהרת זמן, שהעבירה אותנו לעתיד. כי מה שקורה פה בחודשים האחרונים, בכל הנוגע ל- AI, זה לא פחות מקפיצה קדימה בזמן.
זה כבר מזמן לא רק עניין ChatGPT. נדמה שכל תחום בחיים שלנו, זוכה לשדרוג משמעותי בזכות טכנולוגיית ה AI, בוודאי תחום כמו Audio Video.
אז מה קורה כאן בכלל?
במהלך החודשים האחרונים, תחומים רבים, כולל תקשורת, מחשוב ומולטימדיה משתנים לנו מול העיניים בקצב מסחרר. הבינה המלאכותית (Artificial Intelligence) מאפשרת לנו לנהל מערכות ממוחשבות באופן אוטומטי, לזהות בעיות לפני שהן מתרחשות ולפתור אותן במהירות. היכולות של ה- AI לנתח נתונים בזמן אמת, מאפשרות לו לזהות דפוסי פעילות, להבין את הצרכים של המשתמשים ולהתאים את השירותים והפתרונות שלנו, לצרכים המשתנים של הלקוחות. זה מאפשר להגיע לרמות של יעילות ותפוקה שלא היו אפשריות בעבר.
בתחום האודיו וידאו (AV), ה- AI מאפשר כבר היום להעניק חווית משתמש משופרת. במהלך החודשים האחרונים יותר ויותר חברות חומרה ותוכנה בעולם המולטימדיה הצטרפו לחגיגה, והטמיעו את הטכנולוגיה של ה- AI במצלמות, במערכות רמקולים ואפילו בסאונד ברים (מכשירים המשלבים מצלמה, מיקרופון, ורמקולים, המותאמים לחדרי ישיבות קטנים). על ידי שימוש בנתונים על אקוסטיקת החדר, מפרטי הציוד, ודרישות המשתמש, אלגוריתמים מבוססי AI יכולים לחזות בדיוק את איכות ה- Audio Video הנדרשת בכל נקודת זמן, בהתאם לתנאי המקום.
מערכות AI מסוגלות לזהות בעיות באיכות התוצר, כמו תאורה גרועה או צליל מעוות, ולתקן אותם אוטומטית, או לסמן את הבעיות האלה לתיקון אנושי.
בתחום האודיו, טכנולוגיות AI מאפשרות שיפור של איכות הצליל, הפחתת רעשי רקע בזמן אמת במהלך שיחות וידאו, שיפור באיכות השמע ובמובנות הדיבור, וכך מספקות חוויות אודיו משודרגות.
בתחום הווידאו, ה- AI משמש לשיפור עיבוד ואיכות הווידאו (איכות וחדות התמונה) בזמן אמת, במהלך שיחות וידאו. מצלמות חכמות מאפשרות לנתח תמונות, לזהות דפוסים ולהתאים את הפתרונות לדפוסי המשתמשים.
בחודשים האחרונים אנחנו נחשפים לעוד ועוד מוצרים שמאפשרים את הקסמים הללו.
אחת החברות המובילות בתחום האודיו המבוסס AI היא Krisp. החברה פיתחה אלגוריתמיקה מבוססת בינה מלאכותית לטיפול בכל אותם רעשים מרגיזים והסחות דעת בזמן שיחות וועידה. התוכנה שלה אפילו מסייעת בזיהוי מבטאים בעייתיים ותיקונים קלים על מנת להתגבר עליהם. וכמובן (היום כבר אי אפשר בלי) ביצוע תמלול אוטומטי מונחה בינה מלאכותית.
חברה מעניינת נוספת היא חברת ISID. היא מציעה מגוון רחב של פתרונות מבוססי AI לשיפור איכות ה-Audio Video, ניהול, ניתוח ביומטרי על הווידאו ועוד.
כמובן שגם החברות הגדולות בתחום לא נשארות מאחור, וניתן לראות יותר ויותר שילוב של AI בפתרונות AV ו"בית חכם", בזיהוי קולי והפעלות מורכבות, כדוגמת קרסטרון ששילבה את Josh.AI במוצרי הבית החכם שלה.
איפה זה שימושי לנו
היכולות של ה- AI בעולמות ה- AV מעניקות שיפור במגוון עולמות תוכן. למשל במרכזי כנסים וחדרי ישיבות. אם ה- ZOOM ה- TEAMS וחבריהם היו המקפצה הראשונה ששינתה מהותית את האופן שבו אנחנו נפגשים, הגיעה טכנולוגיית ה-AI והעבירה אותנו לא רק מדרגה אחת למעלה, אלא קומה שלמה. כי ה- AI ב- AV מאפשר התאמה פרסונלית וייעול היכולת לקיים ישיבות היברידיות. מצלמות שלומדות אותנו ומתאימות את עצמן אלינו, עוזרים קוליים, ורמקולים חכמים, הם כמה מהכלים שיכולים לשפר את היעילות של ישיבות וירטואליות או היברידיות.
גם במרכזי הדרכה וסימולציה מרגישים ת השינוי. כמעט כל מי שחווה למידה (כמדריך או תלמיד) במרכז סימולציה, מבין את התרומה האדירה שיש למרכזי סימולציה על הלמידה. למרכזים האלה (בתחום הרפואי, הצבאי, החינוכי, המשפטי וכדומה) שמדמים את החוויה המקצועית והאתגרים שלה, מתווסף עכשיו רכיב נוסף. המערכת שלומדת את הלומד ואת הלמידה שלו.
במרכזי הדרכה וסימולציה, ה- AI משמש להגברת היכולת להדריך, להעריך ולתמוך במשתמשים באופן אישי. לדוגמה, במרכזי הדרכה רפואית, עד היום בכל פעם שקרה במהלך הסימולציה, מקרה שבו המדריך מזהה שנדרשת הערה או התייחסות מיוחדת, הוא לחץ על כפתור, כדי לסמן את הרגע הספציפי המחייב התייחסות חוזרת. במערכות המשלבות AI, המערכת כבר עתידה לזהות בעצמה את הרגעים בהם נדרש סימון זה. וכך יוכל המדריך להתפנות רק כדי להביט כל העת בהבעות הפנים של המתרגל (ואולי גם אותן תדע המערכת בעתיד לזהות).
ומה בעתיד?
שורות אלו הן כבר היסטוריה. מאז שישבתי במשרדי וכתבתי אותן, ועד שאתם קוראים אותן, גם אם עברו ימים בודדים, זה היה מספיק זמן כדי לאפשר למפתחים להוסיף עוד יכולות, שהופכות את כלי ה- AI לחזקים עוד יותר. יכולות שעד לא מזמן היו בחזקת פנטזיה. הטכנולוגיה המופלאה הזו תאפשר לנו ליצור, לנתח, ללמוד ולחוות, בדרכים שלא היו אפשריות בעבר.
התקדמות צפויה להתרחש בזכות השיפור בשלוש יכולות עיקריות:
- שיפור מתמשך ביכולת להבין תכנים – מערכות מבוססות AI משתפרות כל הזמן ביכולת שלהן להבין תוכן ברמה העמוקה ביותר. היכולת לנתח תמונות, סרטונים, טקסטים, ואפילו קולות, ולהבין את דקויות המשמעות שלהם. זה יוביל ליצירת חוויית משתמש מתאמת אישית בכל פרמטר.
- אינטראקציה טבעית יותר – מערכות מבוססות AI יכולות להפוך את האינטראקציה עם מערכות מולטימדיה לטבעית ואינטואיטיבית יותר. לדוגמה, הן יכולות להבין שפת גוף וקולות ולהגיב בהתאם.
- יצירת תוכן אוטומטית – מערכות מבוססות AI יכולות ליצור תוכן באופן אוטומטי. לדוגמה, הן יכולות ליצור סרטונים, תמונות, או טקסטים מבוססים על העדפות המשתמש, או להתאים את התוכן שהן מציגות בהתאם להתנהגות המשתמש.
"בלי אור אין חושך", או "כרגיל, לא הכל ורוד"
למרות ההבטחה הגדולה של ה- AI במערכות MULTIMEDIA, הטכנולוגיה הזו מציבה בפנינו גם אתגרים חדשים:
- אבטחת מידע- מערכות מולטימדיה מבוססות AI יכולות לאסוף כמות מידע עצומה, שחלקה עשוי להיות רגיש או אישי, ולכן גם זמין יותר לפגיעה. לכן יש צורך לתגבר את מערכות אבטחת המידע באופן שוטף.
- הבנת המשתמש- למרות ההתקדמות ביכולות של מערכות מבוססות AI להבין תוכן ברמה גבוהה, ההבנה שלהן את המשתמש עדיין מוגבלת. הן יכולות להתקשות להבין את הכוונה שלו, או לטעות בהתאמת הפתרונות להעדפות שלו. מדובר בתהליך מתמשך, המחייב למידה לצד איסוף מידע לאורך זמן. לכן, נכון לכתיבת שורות אלו, עדיין נדרשת בקרה שוטפת (גם אנושית) על פעילות ותוצרי המערכות.
- אינטראקציה טבעית – כבר היום מערכות מבוססות AI מאפשרות להפוך את האינטראקציה עם מערכות מולטימדיה לטבעית יותר, ועם זאת, הן עדיין מתקשות להתממשק עם המשתמש באופן טבעי ואינטואיטיבי. לדוגמה, הן עדיין מתקשות להבין באופן מלא שפת גוף וקולות.
יש לנו טכנולוגיה מדהימה (AI) שֶׁחָבְרָה לתחום מרגש אחר, ה- Multimedia. היא מתקשרת עם כל המכשירים, מסתכלת על המידע, ומתחילה לשנות את הדרך שבה אנחנו עובדים, לומדים ומתקשרים. טכנולוגיה שמקצרת תהליכים, משפרת את האיכות, משנה את הדרך שבה אנחנו מתמודדים עם המידע והתקשורת, מקלה על השימוש בכלים, ומביאה חוויות חדשות למשתמשים.
אבל היא לא עוצרת שם. היא טסה לעבר העתיד ומציפה אותנו באפשרויות. היא צפויה להעניק לנו פתרונות חדשים, שישפרו את השירותים שאנחנו מציעים, ולהפוך את חווית המשתמש בכלי המולטימדיה למשהו שעוד לא ראינו.
נדמה שהמסיבה רק התחילה.
הכותב הוא בעלים ומנכ"ל חברת מדיה קומפאס, חברה לייעוץ, תכנון וניהול פרויקטים רב-מערכתיים של רשתות תקשורת ומחשוב, מולטימדיה, בקרה וביטחון.