מחקר7 בפברואר 20262 דקות·מ־arXiv cs.AIProAct: תכנון קדימה חכם לסוכני LLMסוכני LLM מתקשים בתכנון ארוך טווח? ProAct משנה את חוקי המשחק עם GLAD ו-MC-Critic. מודל 4B עלה על בסיסים פתוחים. קראו עכשיו! (48 מילים)ProActGLADMC-Criticקרא עוד
מחקר29 בינואר 20262 דקות·מ־arXiv cs.AISokoBench: מגבלות תכנון ארוך טווח במודלי שפה גדוליםמחקר חדש ב-SokoBench חושף כי מודלי שפה גדולים נכשלים בתכנון ארוך טווח מעל 25 מהלכים. קראו על המגבלות והפתרונות המוצעים.SokoBenchSokobanLRMsקרא עוד