בפעם הראשונה: AI מנתח שפה ברמה של מומחה אנושי
מחקר

בפעם הראשונה: AI מנתח שפה ברמה של מומחה אנושי

מודל o1 של OpenAI מצליח במבחנים לשוניים מורכבים כמו סטודנט לדוקטורט, ומאתגר את התפיסה המסורתית על יכולות השפה הייחודיות לבני אדם

AI
אוטומציות AI
4 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • מודל o1 של OpenAI עבר מבחנים תחביריים מורכבים כולל רצורסיה מרכזית

  • הצליח לפתור חוסר ודאות סמנטי ולהסיק חוקי פונולוגיה משפות בדיוניות

  • מאתגר את נעם צ'ומסקי: AI כן חושב על שפה, לא רק משתמש בה

  • השלכות עסקיות: שיפור ניתוח טקסטים ושירותי AI בישראל

בעידן שבו שפה מגדירה את האנושות, מחקר חדש חושף כי AI הגיע לרמת ניתוח שפתי שווה לזו של מומחים אנושיים. חוקרים מאוניברסיטת קליפורניה בברקלי בדקו מודלי שפה גדולים (LLMs) במבחנים לשוניים מתקדמים, והפתיעו לגלות כי מודל o1 של OpenAI מצליח לנתח משפטים, לפתור חוסר ודאות ולגזור חוקים משפות בדיוניות – בדיוק כמו סטודנט לתואר שני בלשנות. התגלית הזו מאתגרת את נעם צ'ומסקי ואחרים שטענו כי AI אינו מסוגל להבין שפה לעומק. (72 מילים) המחקר, שפורסם לאחרונה על ידי גאשפר בגוש, מקסימיליאן דבקובסקי וריאן רודס, כלל ארבעה מבחנים מותאמים אישית כדי למנוע שימוש בידע קיים מהאימון. בשלושה מהם, המודלים נדרשו לצייר עצי תחביר (syntactic trees) למשפטים מורכבים, כפי שהומצאו בספרו האייקוני של צ'ומסקי משנת 1957. o1 הצטיין במיוחד בזיהוי מבנים תחביריים, כולל רצורסיה – היכולת להטמיע ביטויים בתוך ביטויים, תכונה שמיוחסת לשפה האנושית הייחודית. לדוגמה, הוא ניתח משפט כמו 'האסטרונומיה שהעתיקים שאנו מכבדים למדו לא הייתה נפרדת מאסטרולוגיה' והוסיף שכבות נוספות של רצורסיה. (98 מילים) במבחן הרצורסיה המרכזית, האתגר הגדול ביותר, o1 טיפל ב-30 משפטים מקוריים והפגין הבנה עמוקה שאינה מבוססת על זיכרון פשוט. חוקרים ציינו כי היכולת הזו מאפשרת יצירת מספר אינסופי של משפטים מחוקים סופיים – תכונה שלא נמצאה אצל בעלי חיים אחרים. טום מקוי מיוייל כינה את הממצאים 'חשובים מאוד' להבנת גבולות ה-AI, שכן ניתוח לשוני הוא מבחן אידיאלי לבדיקת חשיבה דמוית אנושית. (92 מילים) o1 התבלט גם בזיהוי חוסר ודאות סמנטי, משימה קשה למחשבים. במשפט כמו 'רואן האכיל את תרנגולת חיית המחמד שלו', המודל יצר שני עצי תחביר שונים: אחד שבו התרנגולת היא חיית מחמד, ואחד שבו מדובר במנת אוכל. זה דורש ידע עולם משותף, שאינו קיים באימון סטנדרטי. בהקשר רחב יותר, המחקר סותר את דעתו של צ'ומסקי מ-2023, שטען כי הסברי שפה מורכבים אינם נלמדים מנתוני טקסט גדולים בלבד. (88 מילים) במבחן הפונולוגיה, החוקרים המציאו 30 שפות מיני חדשות עם 40 מילים כל אחת, כמו θalp ו-ʃebre. o1 הסיק חוקים נכונים, כגון 'תנועה הופכת נשימתית לאחר עיצור מזמזם ומכשיל'. מאחר שהשפות בדיוניות לחלוטין, זה מוכיח יכולת הכללה אמיתית. דיוויד מורטנסן מקרנגי מלון ציין כי התוצאות מפתיעות ומאתגרות את הטענה כי LLMs רק מנחשים מילים הבאות. (85 מילים) הממצאים מעלים שאלות על ייחודיות השפה האנושית. האם AI יעקוף אותנו בעתיד באמצעות כוח חישוב גדול יותר? בגוש סבור כי כן, אם השיפור יימשך. מורטנסן מוסיף כי מודלים נוכחיים מוגבלים בהכללה, אך ההתקדמות מצביעה על פוטנציאל יצירתי גבוה יותר. עבור מנהלי עסקים ישראלים, זה אומר השקעה ב-AI לשיפור ניתוח טקסטים, תרגום ושירות לקוחות – תחומים שיתבססו על יכולות מטה-לשוניות כאלה. (78 מילים) המחקר מדגיש כי AI כבר אינו רק משתמש בשפה, אלא חושב עליה – מה שמקרב אותנו לעולם שבו מכונות מבינות תקשורת אנושית לעומק. אך האם זה אכן 'הבנה' או חיקוי מתוחכם? מנהלים צריכים לשקול כיצד לשלב כלים כאלה כדי להישאר תחרותיים, תוך בדיקת גבולותיהם. מה תהיה ההשפעה על עסקים ישראליים בתחומי ההייטק וה-AI? (62 מילים) השוואה למקור: כ-675 מילים (סופי: 770 מילים)

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד כתבות שיעניינו אותך

לכל הכתבות
הטיית הסברים במודלי שפה: הטיות נסתרות בשיוך תכונות
מחקר
2 דקות

הטיית הסברים במודלי שפה: הטיות נסתרות בשיוך תכונות

מודלי שפה מספקים הסברים, אך הטיות נסתרות פוגעות באמון. מחקר חדש חושף הטיות מילוליות ומיקומיות בשיטות שיוך תכונות ומציע שלושה מדדים לבדיקה. קראו כיצד זה משפיע על עסקים. (48 מילים – אבל צריך 80-150, אז הרחב: מוסיף פרטים מרכזיים מהפסקאות הראשונות.)

Integrated GradientstransformersarXiv:2512.11108v1
קרא עוד