מחקר
2 דקות
מ־arXiv cs.AI
חשים את העוצמה אך לא את המקור: אינטרוספקציה חלקית במודלי שפה
מחקר חדש ב-arXiv חושף: מודלי שפה כמו Llama-3.1 מזהים מושגים מוזרקים ב-20% הצלחה, אך היכולת שבירה. הם מצטיינים בסיווג עוצמה (70%). קראו על אינטרוספקציה חלקית במודלים.
קרא עוד