אתר זה עושה שימוש בעוגיות על מנת להבטיח לך את חוויית הגלישה הטובה ביותר.
לראות כמו שוורצנגר: גוגל רשמה פטנט על זיהוי אלמנטים בווידאו צילום: בלומברג

לראות כמו שוורצנגר: גוגל רשמה פטנט על זיהוי אלמנטים בווידאו

ענקית האינטרנט פיתחה שיטה חדשה לזיהוי פנים ואלמנטים בווידאו. למה זה טוב? בשביל להציג מידע על אובייקטים שנצפים במשקפי גוגל החכמים, לתייג אוטומטית אנשים בקליפים - ולאתר סרטים שמפירים זכויות יוצרים ביוטיוב

29.08.2012, 17:00 | הראל עילם

משרד הפטנטים האמריקאי העניק אמש (ג') לגוגל פטנט מעניין במיוחד על טכנולוגיה שמאפשרת זיהוי אוטומטי של אובייקטים בסרטי וידאו. החברה מקווה להשתמש בטכנולוגיה על מנת לבצע תיוג אוטומטי של קליפים ביוטיוב ומסוגלת לזהות בניינים, רכבים, אנשים, חיות, מוצרים ועוד.

שילוב של פטנט זה במשקפיים החכמים של גוגל יוכל למעשה, לספק למשתמש מידע על דברים שהוא רואה - בדומה לראיית הסייבורג בסרטי "שליחות קטלנית" ודומיהם. ככל הנראה שבשלב הראשון, תעדיף גוגל להפעיל את הטכנולוגיה ביוטיוב.

הפטנט, מספר 8,254,699, מתבסס על מערכת שמזהה עצמים על ידי בחינת אלמנטים כמו תנועה, מרקם, מבנה, צורה, צבעים ועוד. היא גם תלמד ותשתפר עם הזמן ככל שמשתמשים יעלו יותר סרטים.

היי, זה חתול!

עד כה, מערכות זיהוי פנים וחיפוש ויזואלי התקשו לנתח סרטונים אלא מתמקדות בעיקר בניתוח תמונות סטטיות. מערכות קיימות מבצעות ניתוח על ידי השוואה בין תמונות ובין מאגר נתונים קיים. כך למשל, מערכת זיהוי פנים בודקת עד כמה הפנים המופיעות בתמונה המצורפת דומות לפנים המופיעות במאגר.

אבל הטכניקה הזו לא עובדת בסרטוני וידאו - בהם השינוי מתמונה לתמונה לא מאפשר זיהוי אפקטיבי. במקום לעבוד על מערכת המחפשת דימיון ויזואלי וסטטיסטי, גוגל פיתחה מערכת שמסוגלת לנתח ולהבין מהם האלמנטים שמופיעים בסרטון, וגם מסוגלת ללמוד ולהשתפר.

כך למשל, אם משתמש יעלה מספר סרטוני חתולים ליוטיוב, המערכת תבין שבכל הסרטונים מופיע חתול - על בסיס דימיון ויזואלי, כותרות דומות ואף התיוגים שהמשתמש הוסיף באופן ידני. המערכת תנתח את המאפיינים הפיזיים של החתול ובהמשך תוכל לזהות חתולים בסרטונים אחרים בדיוק הולך וגדל.

למיקרוסופט כבר יש אחד

החברה ציינה כי היא מקווה להשתמש בטכנולוגיה כתכונת תיוג אוטומטי ביוטיוב. החברה גם מפתחת תכונות שכאלה גם ככלי למלחמה בהפרת זכויות יוצרים - זיהוי פנים וזיהוי שירים יאפשר לזהות סרטונים שמועלים ליוטיוב ללא אישור בעליהם המקוריים. ראוי לציין כי מיקרוסופט עובדת מזה מספר שנים על כלי שמסוגל לבצע זיהוי פנים בווידאו, תוך זיהוי אלמנטים פרטניים כמו צבעים וצורות. הכלי הודגם לראשונה בתחילת 2011.

אבל יתכן ובהמשך גוגל תוכל לשלב את המערכת החכמה גם במערכות אחרות, כמו גוגל גוגלס וגם במשקפיים החכמים שלה. כך למשל, היא תוכל להפעיל אפליקציה של מציאות מוגברת שתאפשר למשתמשים לזהות את העצמים שהם רואים דרך המשקפיים בזמן אמת, בדומה לסרט "שליחות קטלנית". 

תגיות