מחקר2 בפברואר 20262 דקות·מ־arXiv cs.AIלמה ההיגיון נכשל בתכנון: ניתוח סוכני LLMבעידן שבו סוכני AI מבוססי LLM מציגים יכולות מרשימות בהיגיון צעד אחר צעד, הם נכשלים בתכנון ארוך טווח. מחקר חדש מציג את FLARE שמשפר ביצועים ומנצח GPT-4o. קראו עכשיו את הניתוח המלא!FLARELLaMA-8BGPT-4oקרא עוד