מחקר
4 דקות
מ־arXiv cs.AI
ReplicatorBench: בנצ'מרק חדש לבדיקת סוכני AI בשכפול מחקרים
ReplicatorBench הוא בנצ'מרק חדש לבדיקת סוכני AI בשכפול מחקרים במדעי החברה. הוא חושף חוזקות בחישובים וחולשות באיתור נתונים חדשים. גלו כיצד זה משפיע על אוטומציה עסקית.
קרא עוד