מחקר29 בינואר 20262 דקות·מ־arXiv cs.AISokoBench: מגבלות תכנון ארוך טווח במודלי שפה גדוליםמחקר חדש ב-SokoBench חושף כי מודלי שפה גדולים נכשלים בתכנון ארוך טווח מעל 25 מהלכים. קראו על המגבלות והפתרונות המוצעים.SokoBenchSokobanLRMsקרא עוד