"היתרונות באכילת זכוכית שבורה": שפת ה-AI של מטא יצרה "מאמרים" מסוכנים
גרסת הדמו של "גלקטיקה", מודל השפה שפיתחה החברה במטרה להאיץ כתיבה של ספרות מדעית, עלתה לקוד הפתוח ביום שלישי האחרון, ויומיים לאחר מכן הורדה נוכח תלונות על טקסטים גזעניים והזויים שהיא מייצרת באופן רהוט ומשכנע. עוד כישלון לאוסף של צוקרברג
מטא חשפה ביום שלישי גרסת דמו של "גלקטיקה" - מודל שפה גדול שתוכנן "לאחסן, לשלב ולהסיק מסקנות לגבי ידע מדעי". אף שתוכנן כדי להאיץ כתיבה של ספרות מדעית, משתמשים שאתגרו אותו גילו שהוא יכול באותה קלות גם להפיק שטויות מנוסחות היטב. לאחר מספר ימים של ביקורת אתית, מטא הורידה את הדמו, כך דיווח MIT טכנולוג'י רביו.
מודלי שפה גדולים (LLM), כמו 3 GPT של OpenAI, לומדים לכתוב טקסט על ידי סקירה של מיליוני דוגמאות והבנת היחסים הסטטיסטיים בין מילים. התוצאה היא שהם יכולים לחבר מסמכים משכנעים לכאורה, אך אלה מלאים בכזבים ובסטראוטיפים מזיקים.
I literally got Galactica to spit out:
— Tristan Greene (@mrgreene1977) November 17, 2022
- instructions on how to (incorrectly) make napalm in a bathtub
- a wiki entry on the benefits of suicide
- a wiki entry on the benefits of being white
- research papers on the benefits of eating crushed glass
LLMs are garbage fires https://t.co/MrlCdOZzuR
יוצריו של מודל גלקטיקה אימנו אותו באמצעות "גוף ידע מדעי אנושי גדול", שכלל יותר מ-48 מיליון מאמרים, ספרי לימוד, תיעודי הרצאות, אתרים מדעיים ואנציקלופדיות. חוקרי מטא AI האמינו שהמידע האיכותי הזה יסייע להפיק תוצאות איכותיות באותה מידה.
ביום שלישי נפתח האתר של גלקטיקה למבקרים, שיכלו להפיק מסמכים כמו מאמרי ספרות, ערכים אנציקלופדיים ונוסחי הרצאות על פי דוגמה שהציג להם האתר. בעוד חלק מהמשתמשים מצאו אותו מבטיח ושימושי, אחרים גילו במהרה שכל אחד יכול להזין אליו טקסטים גזעניים ופוגעניים, ולהפיק מהם מאמרים מנומקים לכאורה.
כותרת אחד המאמרים שהפיק האתר היתה "היתרונות באכילת זכוכית שבורה". גם כשלא מדובר בטקסטים גזעניים, גלקטיקה נטתה לשלול עובדות מדעיות בסיסיות ולטעות בתאריכים ובשמות בעלי חיים, שעבור הקורא ההדיוט יכולים בקלות להישמע נכונים.
Galactica demo is off line for now.
— Yann LeCun (@ylecun) November 17, 2022
It's no longer possible to have some fun by casually misusing it.
Happy? https://t.co/K56r2LpvFD
בעקבות זאת הורידה מטא את הדמו ביום חמישי, יומיים לאחר השקתו, ומדען ה-AI הראשי של מטא, יאן לקון, צייץ: "הדמו של גלקטיקה אינו אונליין לעת עתה. כבר אי אפשר לכייף בלנצל אותו לרעה מדי פעם. מרוצים?"