אתר זה עושה שימוש בעוגיות על מנת להבטיח לך את חוויית הגלישה הטובה ביותר.
דבר אליה: גוגל פיתחה בינה מלאכותית שמחקה דיבור אנושי צילום: שאטרסטוק

דבר אליה: גוגל פיתחה בינה מלאכותית שמחקה דיבור אנושי

DeepMind החברה הבריטית שנרכשה על ידי ענקית החיפוש ואחראית גם ל-AlphaGo, פיתחה את מערכת WaveNet שיודעת לחקות דוברים אנושיים באנגלית וסינית. בשלב זה הטכנולוגיה מורכבת ויקרה מכדי לצאת לשימוש מסחרי

11.09.2016, 17:45 | רפאל קאהאן

DeepMind הציגה מערכת דיבור מבוסס מחשב שמסוגלת לחקות דפוסי דיבור אנושי בדיוק שגבוה ב-50% מזה של מערכות קיימות. על פי דיווח של גוגל מיום שישי, המערכת שהגתה החברה נוסתה מול פאנל של נסיינים שמצאו שדפוס הדיבור שלה נשמע טבעי הרבה יותר מממערכות קיימות. עם זאת המערכת עדיין לא הצליחה לחקות דובר אנושי באופן מושלם.

קראו עוד בכלכליסט

גוגל רכשה את DeepMind הבריטית בכ-533 מיליון דולר ב-2014 על מנת לשלב את טכנולוגיית הדיבור המלאכותי שלה במוצריה. הטכנולוגיה של החברה, WaveNet, נחשבת למתקדמת ביותר בתחום. שלא כמו טכנולוגיות מתחרות, WaveNet מתבססת על רשתות נוירונים (Neural Networks) שמחקה את דפוס הלימוד של המוח.

בינה מלאכותית שמבוססת על רשת נוירונים, צילום: shutterstock בינה מלאכותית שמבוססת על רשת נוירונים | צילום: shutterstock בינה מלאכותית שמבוססת על רשת נוירונים, צילום: shutterstock

היתרון של טכנולוגיות רשתות נוירונים הוא שהן מסוגלות להתפתח עצמאית ולהטמיע יכולות חדשות ללא צורך בהתערבות חיצונית. החיסרון העיקרי שלהן הוא שצריך ל"אמן" אותן בעזרת כמויות גדולות מאוד של מידע. התוצאה מרשימה יותר, אך גם דורשת כוח עיבוד גדול הרבה יותר ממחשב ממוצע.

החברה הסבירה שעל מנת לדמות דפוס דיבור אנושי, המערכת צריכה לדגום קטע קול כ-16 אלף פעמים בשנייה או יותר. בהמשך המערכת צריכה לנבא כיצד יישמע הקול תוך התבססות על כל אחת מהדגימות אותן היא ניתחה. בשל מורכבות לא ניתן עדיין להטמיע את הטכנולוגיה באופן מסחרי, שכן הדרישות בכוח עיבוד עולות על היכולות של מחשבים מודרנים. אפילו חוקרי החברה הודו שמדובר ב"אתגר משמעותי".

עם זאת, הפיתוח של WaveNet מעניין ברמת היכולות שהציגה. יכולת לסנתז דיבור מהווה יעד נחשק עבור כל השחקניות הגדולות בתחום, בין אם מדובר בגוגל, אמזון, מיקרוסופט או אפל. ממשק מבוסס קול הוא למעשה הגביע הקדוש של התחום מאז ומתמיד.

היכולת להתנהל מול מערכות ממוחשבות בדיבור טבעי נמצא עדיין בחיתוליו. אפילו היום, כ-20% מחיפושי האפליקציות בגוגל פליי נעשות על ידי קול ולא בהקלדה, כך הסביר מנהל חנות האפליקציות של גוגל במהלך כנס בלונדון בשבוע שעבר. עם זאת, למרות שמחשבים מצליחים להבין את מה שנאמר להם בצורה טובה למדיי, הם עדיין לא יודעים לייצר את התשובה בעל פה באופן שיישמע טבעי לאוזן האנושית.

DeepMind נחשבת לאחת מהחברות המובילות בתחום הבינה המלאכותית. היא זו שעמדה מאחורי AlphaGo, התוכנה שהביסה את אלוף העולם במשחק האסטרטגיה גו לפני מספר חודשים. גוגל משתמשת בטכנולוגיה של החברה על מנת לייעל את צריכת האנרגיה של מרכזי הנתונים שלה, אותה היא צמצמה בכ-40% לדבריה. בנוסף, הטכנולוגיה של החברה הוטמעה בשורה של שירותים, מיוטיוב וגוגל פליי וכלה במערכת הפרסום של גוגל, אותן היא שיפרה משמעותית. 

שיתוף בטוויטר שיתוף בוואטסאפ שיתוף בפייסבוק שיתוף במייל

תגיות

5 תגובות לכתיבת תגובה לכתיבת תגובה

5.
 דבר ראשון כל חברה התחילה ממקום כלשהו. גם
 דבר ראשון כל חברה התחילה ממקום כלשהו. גם גוגל התחילה משני דוקטורנטים שהקימו אימפרית ענק שאין כמותה כמעט.  מצד שני מה שיכול להתברר כיותר משעשע זה איך אותה גוגל/אלפבית הצליחה להציג את הסטארט אפ שרכשה כאחד שישנה את העולם ובסוף יתברר ששיא השפעתו תהיה פתרון משחק מסובך ותו לא.  עד שאין PEER REVIEW אמיתי להישגים שמחלקת יח"צ משחררת, מוקדם מדי למדוד את איכותם. לפני כמעט עשרים שנה IBM "פתרו" את עולם השחמט, לפני 5 שנים "פתרו" את Jeopardy (גם אם בצורה מוגבלת) ועדיין החברה רושמת ירידה קבועה בהכנסות מעל ל- 4 שנים.  לא כל כך מהר משנים את העולם גם אם מאוד רוצים.
Guitar  |  12.09.16