מחקרים ופרסומים אקדמיים בתחום הבינה המלאכותית
AgentCPM-Report, סוכן AI חדשני לכתיבת דוחות מחקר עמוקים, מתעלה על מודלים סגורים ומפעל מקומית. גלה כיצד הוא משנה את התחום. התחל עם [סוכני AI](/services/ai-agents) עכשיו.
קרא עודHyPER משפרת היגיון ב-LLM ב-10% עם 40% פחות טוקנים. שיטה דינמית ללא אימון שמתאימה לעסקים ישראלים. גלו כיצד ליישם.
קרא עודJADE פותרת דילמה בהערכת AI סוכני: שילוב יציבות וגמישות. מחקר חדש מוכיח שיפור בביצועים על BizBench. חיוני לעסקים ישראליים.
קרא עודAgentCPM-Explore, סוכן AI של 4B פרמטרים, משיג SOTA ומתעלה על מודלים גדולים. גלו כיצד זה משנה את עולם האוטומציה. התחילו עם [סוכני AI](/services/ai-agents) עכשיו!
קרא עודבנצ'מרק חדש חושף שמודלי שפה גדולים חלשים בסימבוליזציה לוגית ובניית מודלים נגדיים, למרות הצלחה בהערכת תקפות. גלו את ההשלכות לעסקים ישראליים.
קרא עודמודלי שפה גדולים נכשלים במשימות ארוכות בגלל חוסר יציבות אוטורגרסיבי, לא רק מורכבות. מחקר חדש מציע מבנים גרפיים כפתרון. גלו כיצד זה משפיע על עסקים ישראליים.
קרא עודבנצ'מרק GrAlgoBench חושף חולשות במודלי חשיבה גדולים: דיוק נמוך בגרפים גדולים וחשיבה מיותרת. גלו כיצד זה משפיע על AI עסקי.
קרא עודמחקר חדש בודק אם מודלי שפה גדולים פועלים כסוכנים רציונליים באתגרי אבחון רפואי. התוצאות חושפות תובנות על עקביות אמונותיהם. גלו כיצד זה משפיע על עסקים.
קרא עודמודלי שפה גדולים נכשלים בהיגיון פשוט? סקר חדש ב-arXiv מציג סיווג מקיף של כשלי היגיון ב-LLMs ומציע פתרונות. קראו על ההשלכות לעסקים ישראלים והורידו את המאגר מ-GitHub.
קרא עודJackpot מציגה מסגרת חדשה ללמידת חיזוק יעילה ב-LLM, מפחיתה עלויות ומשפרת יציבות. גלו כיצד זה משפיע על עסקים ישראליים.
קרא עודבעידן שבו מודלי שפה גדולים נתקלים בקושי להגיע לרמת חשיבה של מומחים, חוקרים מציגים את ALIVE – מסגרת אימון פורצת דרך שמתגברת על בעיית התגמולים ומשפרת ביצועים במתמטיקה, קוד ולוגיקה. קראו את הניתוח המלא עכשיו! (112 מילים)
קרא עודבעידן שבו אינטראקציה בין אדם למחשב הופכת חכמה יותר, סוכני GUI בנייד הם המפתח להתקדמות. החוקרים מציגים את M²-Miner, מסגרת כריית נתונים אוטומטית בעלות נמוכה ראשונה מסוגה. קראו כיצד היא משנה את חוקי המשחק. קראו עכשיו!
קרא עודמחלקות ניהול בבתי חולים גדולים מטפלות בלמעלה מ-10,000 בקשות יומיות. H-AdminSim, מסגרת סימולציה חדשה, מאפשרת בדיקת אוטומציה מבוססת LLM בזרימות עבודה מלאות עם שילוב FHIR. קראו עכשיו על הפוטנציאל לשיפור יעילות. (112 מילים)
קרא עודבעידן שבו LLM רפואיים תופסים מקום בחינוך מטופלים ברפואת עיניים, מחקר חדש בדק ארבעה מודלים קטנים ומצא: Meerkat-7B מצטיין. קראו עכשיו על התוצאות והשלכות.
קרא עוד