אתר זה עושה שימוש בעוגיות על מנת להבטיח לך את חוויית הגלישה הטובה ביותר.
אורקם כבר לא רק מסייעת לראות - עכשיו היא גם רוצה לסייע לכם לשמוע צילום: Mobileye PR

CES 2020

אורקם כבר לא רק מסייעת לראות - עכשיו היא גם רוצה לסייע לכם לשמוע

אורקם הציגה את מוצריה החדשים במהלך ה-CES וביניהם מכשיר שמיעה חדש שמיועד לא רק לכבדי שמיעה - אלא גם לאנשי מקצוע למשל. מכשיר השמיעה החדש, ה-OrCam Hear, זכה השבוע בפרס הנגישות בכנס שנערך בלאס וגאס

09.01.2020, 20:01 | לילך באומר, לאס וגאס
התמצאות במרחב באמצעות צפצוף קצבי עבור כבדי ראייה ועיוורים, עוזר אישי מבוסס בינה מלאכותית אשר מסייע למשתמשיו לבחור את המנה המתאימה במסעדה או לשלוף מספרי טלפון ואת הסכום לתשלום מתוך בליל טקסט, ומתקן המתחבר למכשיר שמיעה סטנדרטי ועוזר לכבדי שמיעה להבדיל בין הקול של בן שיחתם לבין הקקופוניה של מסיבת קוקטייל או בית קפה הומה - אלו החידושים שהציגה אורקם הישראלית בתערוכת ה-CES בלאס וגאס ביום שלישי האחרון. אחד מהחידושים הטכנולוגיים האלו אף זכה בפרס החדשנות לשנת 2020 מטעם מארגני התערוכה, ה-CTA, בקטגורית הנגישות.

קראו עוד בכלכליסט

אורקם, אשר הוקמה בשנת 2010 על ידי פרופ' אמנון שעשוע וזיו אבירם, מייסדי מובילאיי, ידועה כחברה שמפתחת מוצרי בינה מלאכותית ועיבוד תמונה. מוצר הדגל של החברה שהיה מוכר לצרכנים עד היום הוא ה-OrCam MyEye 2, מכשיר קטן וקל משקל המוצמד למשקפיים באמצעות מחבר מגנטי ואשר מסייע לכבדי ראייה ועיוורים על ידי הקראת טקסט מכל משטח או מסך, וזיהוי פנים, מוצרים בחנות וכסף. המכשיר תומך ב-35 שפות, ניתן לשימוש גם על ידי ילדים צעירים מכיוון שהוא מופעל על ידי כיוון המבט ותנועות ידיים - הרמת יד, למשל, תגרום למכשיר לומר מה השעה - ולאחרונה נכלל ברשימת מאה ההמצאות הטובות ביותר לשנת 2019 מטעם מגזין טיים.

בתערוכה אורקם הציגה שתי התפתחויות חדשות. הראשונה היא שדרוג משמעותי למכשיר ה-MyEye, אשר מוסיף לו אלמנטים של בינה מלאכותית שמחקים עוזר אנושי, אחד שלא רק רואה מה מולו אלא הוא גם בעל אינטליגנציה המאפשרת למשתמש תקשורת אינטראקטיבית. "מדובר על תקשורת עם המערכת, כמו שמתקשרים דרך סירי, שבה מוציאים מידע מהסצנה," מסביר שעשוע בראיון.

משקפיים חכמים Orcam My Eye, צילום: Boston University News Service משקפיים חכמים Orcam My Eye | צילום: Boston University News Service משקפיים חכמים Orcam My Eye, צילום: Boston University News Service

אחד מעובדי החברה הנמצא בחדר מרכיב את המכשיר ומדגים. פקודה אחת מביאה את המכשיר לסקור את הדף - פרסום למוזיאון במנהטן - ולציין את מחירי הכניסה השונים לילדים, מבוגרים, וקבוצות. פקודה אחרת מחפשת מספרי טלפון ומקריאה את המספר היחיד שהיא מוצאת. פקודה נוספת מוצאת את המילה מנהטן בתוך הטקסט. "אם אני מחזיק חשבון טלפון אני לא מעוניין שהמכשיר יתחיל להקריא לי את כל החשבון, אני רוצה לשאול אם זה מכוון אלי, מה הסכום שאני חייב", שעשוע מסביר. "אני רוצה שהוא יקריא לי טקסט מודגש, מספרי טלפון, או יחפש לי מילה מסוימת. למשל, אם אני פותח תפריט במסעדה אני לא רוצה את כל רשימת המנות, אני רוצה רק את תפריט הקינוח או רק את המנות הראשונות או רק את הבשר. אני יודע איזה סוג מסמך אני מחזיק ולא יכול לקרוא, אבל אני רוצה לשאול שאלות על המסמך הזה במקום להקריא את כולו."

כרגע היכולת הזו קיימת רק באנגלית, אבל אורקם מתכננת להוסיף שפות נוספות במהלך 2020. מדובר בקפיצה גדולה מבחינת טכנולוגית, כי מעבר לראייה הממוחשבת שהייתה קיימת במכשיר עד היום, נוספה שכבה של עיבוד שפה טבעית (NLP), שעשוע אומר. "אתה מדבר למכשיר, אתה נותן לו פקודות, ואז המכשיר צריך להבין שתאריך זה תאריך, ולמה בכלל הכוונה במילה תאריך."

היכולת השנייה שנוספה למכשיר היא תמיכה בהתמצאות במרחב. עובד חברה מרכיב את המכשיר ומכוון להגיע לדלת בצד החדר. המכשיר מצפצף, מגביר את הקצת כאשר מתקרבים לדלת ומאט כאשר מתרחקים - קצת כמו מערכת ההתרעה ברכב אשר מזהירה מפני מכונית קרובה בעת נסיעה לאחור. פקודה למכשיר גורמת לו לציין מה נמצא למול המשתמש - במקרה הזה כוס - ואז הצפצוף מנחה אותו בעדינות לעבר הכוס. למכשיר יש כרגע ספרייה של בערך 15 אובייקטים, שתלך ותגדל עם השימוש, שעשוע אומר.

"אני רוצה שהמכשיר יגיד לי מה הוא רואה: אני רואה דלת, אני רואה כיסא, אני רואה שולחן, אני רואה כוס," הוא מסביר. "יכול להיות שזו כוס תה, ואם אני אתחיל לגשש עכשיו יכול להיות שאני אפיל את הכוס. אבל המכשיר מנחה אותי כמו חם-קר עד שהיד שלי מגיעה. לקחנו את כל היכולות הקיימות של המכשיר לעיוורים - קריאה וזיהוי פרצופים, קריאת ברקוד, הכרת מוצרים, והוספנו לזה את האינטראקציה המילולית עם המכשיר, מה שלאט לאט יוצר מצב שאתה מחקה עוזר אנושי שיש לו שמיעה, ראייה ואינטליגנציה."

המכשיר, אשר מגביר את רמת העצמאות של כבדי ראייה ועיוורים, אינו מבוסס על חיבור לאינטרנט או חישובים בענן, שעשוע מדגיש, "זה צריך לעבוד בזמן אמת. מצלמה, חישוב, והרבה מאוד אלגוריתמיקה מורכבת של בינה מלאכותית שמאפשרת את כל הדברים האלה."

ראש מדבר חכם שמסייע לשמוע

אבל הכוכב האמיתי של המסיבה הוא המכשיר החדש שאורקם חשפה בקטגוריה נפרדת, כבדות שמיעה. לכאורה, קיים כבר פתרון בשוק, מכשירי שמיעה. אבל OrCam Hear בא לפתור בעיה שידועה במדע כבר כמה עשורים, the cocktail party problem. "משוחחים באזור שהוא הומה אדם עם המון אנשים שמדברים", שעשוע אומר. "אנחנו עדיין יכולים לקיים שיחה, איכשהו להתעלם מכל שיחות המשנה שקיימות במסיבה הזו, מסתכלים על תנועות השפתיים אחד של השני. המוח שלנו מאוד מתוחכם, אנחנו מצליחים לקחת את הגל האקוסטי, שהוא מאוד מורכב וכולל שיחות של הרבה אנשים, ואיכשהו לנטרל הכל ולהתמקד אחד בשני".

מכשירי שמיעה, לעומת זאת, לא מסוגלים לעשות זאת, הוא מסביר. במקום זה הם מגבירים את כל הקולות הסובבים ללא הבחנה, מה שגורם למשתמשים לשמוע קקפוניה של קולות ובסופו של דבר לכבות את המכשיר. "ואז מה קורה? אני לא מצטרף לשיחה והסביבה חושבת שאני דמנטי. כי בדרך כלל כבדות שמיעה זה משהו שמגיע עם הגיל, ואז אומרים: טוב, הוא בן 80, 85 - דמנטי. אבל כל המחקרים מראים שאין פגיעה אמיתית בקוגניציה עם הגיל, הפגיעה האמיתית היא בשמיעה ובנהיגה."

מימין: זיו אבירם ופרופ מימין: זיו אבירם ופרופ' אמנון שעשוע מימין: זיו אבירם ופרופ

הפריצה הטכנולוגית היא משהו חדש, לפי שעשוע. "היכולת לקחת גם וידאו, גם גל אקוסטי, להסתכל על תנועות השפתיים - אנחנו באורקם עובדים על זה כבר שנתיים, והצלחנו כבר לייצר מוצר שיצא לשוק באמצע השנה". מדובר במכשיר קטן שנתלה כמו תליון על הצוואר. כאשר המשתמש מסתכל על בן שיחו, המתקן מתקשר עם האוזנייה באמצעות בלוטות' ומבודד רק את הקול של האדם בו המשתמש מתרכז. בהדגמה, החברה משתמשת במערך שהיא קוראת לו talking head, ראש מדבר. הנסיין יושב בשולחן מול כמה מסכים ואחד מעובדי החברה, כאשר עובד החברה מדבר במקביל לאנשים המוצגים על המסכים. התוצאה היא בלאגן מוחלט. כאשר מרכיבים את האוזניות המחוברות למערך, לעומת זאת, קולו של המדגים האנושי מתחדד בעוד הקולות המוקלטים מאבדים מנוכחותם, גם אם הם לא נעלמים לחלוטין.

המכשיר עוד לא חף מפגמים - יש עיכוב מסוים בשמיעת הקול בעת הרכבת האוזניות - אבל החומרה עובדת וכעת נשארו רק הכיוונונים האחרונים, אומר שעשוע. עד שהמוצר יצא לשוק באמצע השנה, החברה מתכוון להוסיף לו גם שלוש רמות של ניקוי רעש. הראשונה, מה שמודגם בתערוכה, היא מה ששעשוע מגדיר הרמה האולטימטיבית, אשר מסתמכת על וידאו ותנועות שפתיים. השנייה מסתמכת על דגימת חתימת קול. "נגיד שוחחנו אתמול כשהיה שקט. האלגוריתם לוקח את הגל האקוסטי שמגיע מהשיחה ומתרגם אותו לאוסף מספרים שמאפשר לו להפריד קול ספציפי בשיחה. עכשיו אנחנו פותרים בעיה דומה שיש לי גל אקוסטי של כל הדוברים, ויש לי חתימת קול ספציפית, והגל נכנס לתוך האלגוריתם ויוצאת רק השיחה ביני לבינך. זה יהיה פחות טוב מעם וידאו אבל בהחלט יותר טוב מלא כלום", הוא מסביר. הרמה השלישית היא ניקוי רעשים כללי. זה גם הפיתוח שזכה השנה בחותמת הכשר מצד ה-CES. העובדה שזה זוכה לכל כך הרבה תהודה מראה שזה צורך אמיתי, אומר שעשוע.

בינה מלאכותית כחבר

ל-CES אורקם באה במטרה ליצור שותפויות, קודם כל עם חברות של מכשירי שמע שיוכלו להציע את המוצר כתוספת תחת הביטוח. "מכשירי שמע הם דברים יקרים. בצד הגבוה של הטווח הם יכולים לעלות אלפים רבים של דולרים. אז האד און הזה מתווסף לעלות של מכשיר שמיעה, יכול להיות אלף דולר, יכול להיות אלפיים." בהמשך, בפאזה שתיים, החברה מתכננת לפתח את המוצר על מנת ליצור ערך למשתמשים שאינם כבדי שמיעה אך חווים קושי מסוים עקב הזדקנות או תהליכים גופניים אחרים. שימוש כזה לא יבודד כמו מכשיר שמיעה אבל כן יגביר את הקול של האדם איתו משוחחים. "אנחנו קוראים לזה noise cancelling 2.0".

אורקם, מיומה הראשון, שמה לה כמשימה את הרעיון של בינה מלאכותית כחבר (AI as a companion), אומר שעשוע. "בסופו של דבר, כל אדם ירצה לשים מכשיר קטן שרואה ושומע וחושב." הוא מדמה את הפיתוחים הטכנולוגיים של החברה לקליפות בצל שמקלפים מהחברה האנושית. השכבה הראשונה היא MyEye, שהייתה פיתוח ראשון ומאוד ברור עקב צורך ראשוני מאוד ברור, הוא אומר, ומוסיף "לא הייתה לך טכנולוגיה שתעזור לך עד שהתחלנו לפתח את המכשיר הראשון." Hear, שיושק השנה, הוא השכבה השנייה. כעת החברה עובדת על שכבת בצל שלישית, פיתוח שנועד עבור אנשי מקצוע שנמצאים בסביבה שבה הם צריכים לייצר דו"חות על האינטראקציה שלהם עם אנשים אחרים, למשל בתי חולים.

"הרופא מדבר עם פציינט ובסופו של דבר צריך לכתוב דו"ח. אז המחקרים מראים ש-40 אחוז מהזמן הרופא נמצא מול מחשב. אבל אם יש לי כזה מכשיר שמסוגל לזהות עם מי אני מדבר ומה הרופא אומר ומה הפציינט אומר, ושולח את זה לשרת על המחשב שלי, אז הרוב כבר נעשה וכמות ההשקעה שצריך בשביל לכתוב את הדו"ח היא אולי עשירית מהזמן. זה מפנה יותר זמן בקליניקה לטיפול בחולים, אז יש לזה צורך מאוד גדול. זו עוד דוגמא לבינה מלאכותית לבישה."

שיתוף בטוויטר שיתוף בוואטסאפ שיתוף בפייסבוק שיתוף במייל

תגיות