מחקר
2 דקות
מ־arXiv cs.AI
RIFT: מבחן חדש חושף ירידה של 72% בעקיבת הוראות ב-LLM
מודלי שפה גדולים נכשלים בעקיבה אחר הוראות לא סדרתיות, עם ירידה של 72% בדיוק – כך חושף מבחן RIFT החדש. קראו על הממצאים והשלכותיהם לעסקים. קראו עכשיו.
קרא עודכל החדשות והניתוחים שלנו בנושא RIFT — מתורגמים ומסוכמים ממקורות מובילים בעולם, עם הקשר עסקי ישראלי. 2 כתבות.
מודלי שפה גדולים נכשלים בעקיבה אחר הוראות לא סדרתיות, עם ירידה של 72% בדיוק – כך חושף מבחן RIFT החדש. קראו על הממצאים והשלכותיהם לעסקים. קראו עכשיו.
קרא עודמאיצי AI ענקיים מציבים אתגרים לבדיקות תקלות – RIFT החדשה משתמשת בלמידה מחוזקת כדי להאיץ ב-2.2x, לחסוך 99% בבדיקות ולשפר כיסוי. קראו על הפריצה במחקר. (48 מילים) הרחבה מלאה כאן.
קרא עוד