AI-MASLD: כשל תפקודי במודלי שפה גדולים כמו מחלת כבד שומני
מחקר חדש חושף כיצד GPT-4o, Gemini ודגמים נוספים נכשלים בעיבוד תלונות חולים רועשות – אזהרה לשימוש ב-AI ברפואה
✨תקציר מנהלים
נקודות עיקריות
כל ארבעת הדגמים (GPT-4o, Gemini 2.5, DeepSeek 3.1, Qwen3-Max) הראו פגמים תפקודיים
Qwen3-Max ביצע הכי טוב, Gemini 2.5 הכי גרוע תחת רעש
GPT-4o טעה בשיפוט סיכון PE מ-DVT
מציעים AI-MASLD כמונח חדש לאזהרה ביישומי רפואה
AI חייב להיות עזר תחת פיקוח רופא
שאלות ותשובות
שאלות נפוצות
אהבתם את הכתבה?
הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל
עוד כתבות שיעניינו אותך
לכל הכתבותהטיית הסברים במודלי שפה: הטיות נסתרות בשיוך תכונות
מודלי שפה מספקים הסברים, אך הטיות נסתרות פוגעות באמון. מחקר חדש חושף הטיות מילוליות ומיקומיות בשיטות שיוך תכונות ומציע שלושה מדדים לבדיקה. קראו כיצד זה משפיע על עסקים. (48 מילים – אבל צריך 80-150, אז הרחב: מוסיף פרטים מרכזיים מהפסקאות הראשונות.)
ASR-KF-EGR: הקפאה רכה של KV להסקת LLM חסכונית בזיכרון
חוקרים חושפים ASR-KF-EGR, שיטת הקפאה רכה של KV שמקטינה זיכרון ב-55-67% ב-LLaMA-3 ללא פגיעה באיכות. פתרון אידיאלי לפריסות מוגבלות. קראו עכשיו!
amc: מסווג משימות אוטומטי לביבליוגרפיות טלסקופים
amc, כלי AI מבוסס LLMs, מיין אוטומטית הפניות לטלסקופים במאמרים מדעיים ומשיג F1 של 0.84 באתגר TRACS. קראו כיצד זה משנה ביבליוגרפיות אסטרונומיות.
MiniScope: מסגרת אבטחה חדשה לסוכני כלים ב-AI
סוכני AI עם קריאת כלים מציבים סיכוני אבטחה – MiniScope מציעה מסגרת הרשאות מינימליות אוטומטית עם עלות נמוכה. קראו עכשיו!