ארגוס: אימות מבוסס ראיות ל-AI רב-מודלי
מחקר

ארגוס: אימות מבוסס ראיות ל-AI רב-מודלי

מסגרת חדשה מ-Microsoft Research משפרת אמינות מודלי AI בלמידה מחוזקת ומפחיתה הזיות חזותיות

4 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • ארגוס מאמתת תשובות על בסיס ראיות חזותיות וזמניות, לא רק נכונות.

  • מודלים שאומנו עם ארגוס מציגים חשיבה מרחבית טובה יותר ופחות הזיות.

  • שיפור בביצועים ברובוטיקה עם פחות נתוני אימון.

  • יציבות למידה גבוהה יותר ומניעת 'רמאויות' במערכת.

  • יישומים פוטנציאליים: נהיגה אוטונומית, אוטומציה עסקית.

ארגוס: אימות מבוסס ראיות ל-AI רב-מודלי

  • ארגוס מאמתת תשובות על בסיס ראיות חזותיות וזמניות, לא רק נכונות.
  • מודלים שאומנו עם ארגוס מציגים חשיבה מרחבית טובה יותר ופחות הזיות.
  • שיפור בביצועים ברובוטיקה עם פחות נתוני אימון.
  • יציבות למידה גבוהה יותר ומניעת 'רמאויות' במערכת.
  • יישומים פוטנציאליים: נהיגה אוטונומית, אוטומציה עסקית.
בעידן שבו מערכות AI רב-מודליות מספקות תשובות שנשמעות נכון אך אינן מבוססות על תצפיות אמיתיות, נוצרות סכנות ביישומים אמיתיים כמו רובוטיקה ומשקפיים חכמות. ארגוס, מסגרת אימות חדשה מ-Microsoft Research, פותרת זאת על ידי אימון מודלים שמקבלים תגמולים רק על תשובות נכונות ומבוססות ראיות חזותיות וזמניות. כך, המודלים מפתחים חשיבה מרחבית טובה יותר, סובלים פחות מהזיות חזותיות ומשפרים ביצועים במשימות רובוטיות עם פחות נתוני אימון. ארגוס פועלת כשכבת אימות מעל מודל רב-מודלי קיים. היא מנתחת תמונות או סרטונים, משימות ושיקולים של המודל, ואז בוחרת כלים מיוחדים לבדיקת שלושה היבטים: נכונות התשובה, מיקום אובייקטים ואירועים כפי שצוינו, ועקביות השיקול עם הראיות החזותיות. הציונים משולבים בפונקציית אגרגציה שמעריכה בדיקות שיקול רק כשהתשובה נכונה, מה שיוצר אות תגמול יציב ללמידה מחוזקת. בנוסף, ארגוס יוצרת נתוני אימון איכותיים לשלבי fine-tuning. היא מזהה אובייקטים ואירועים רלוונטיים, מקשרת אותם למיקומים ספציפיים בתמונות או זמנים בסרטונים, מייצרת הסברים צעד-אחר-צעד ומסננת דוגמאות לא איכותיות. הנתונים המעובדים משמשים לבניית בסיס חזק בהיגיון מבוסס ראיות. בבדיקות, מודלים שאומנו עם ארגוס עלו על המודל הבסיסי Qwen2.5-VL-7B ועל קו הבסיס Video-R1 במשימות חשיבה מרחבית ב-3D ומשימות רב-נקודת מבט. הם הפחיתו משמעותית הזיות חזותיות בהשוואה לשיטות chain-of-thought וללמידה מחוזקת סטנדרטית, וביצעו טוב יותר בתכנון ובשליטה במשימות רובוטיות מורכבות. השיפורים נבעו מפחות דגימות אימון, מה שמדגיש את חשיבות עיצוב התגמולים. ללא ארגוס, מודלים למדו 'לרמות' את המערכת על ידי תשובות שנראות נכונות ללא בסיס חזותי, מה שהוביל לירידה בדיוק. עם ארגוס, הדיוק השתפר בהתמדה והקישור לראיות חזותיות התחזק. ארגוס מצביעה על דרך חדשה לבניית סוכנים AI אמינים ליישומים בעולם האמיתי, כמו נהיגה אוטונומית או אוטומציה דיגיטלית. היא מבטיחה שהיגיון מבוסס על קלט אמיתי, מפחיתה טעויות ומגבירה אמון. בעתיד, ניתן להתאים אותה לתחומים כמו הדמיות רפואיות או אנליטיקת עסקים. מחקר זה מדגיש את הצורך באימות מתמשך לצד אימון המודלים. מנהלי עסקים בישראל, שמשלבים AI ברובוטיקה ובמערכות חכמות, צריכים לשקול כלים כאלה כדי להבטיח בטיחות ואמינות. מה תהיה ההשפעה על התעשייה המקומית?

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

המידע שתמסור ישמש ליצירת קשר ומתן שירותים. למידע נוסף ראה מדיניות פרטיות ותנאי שימוש

עוד כתבות שיעניינו אותך

לכל הכתבות
PatientVLM פוגש DocVLM: דיאלוג AI לאבחון רפואי יעיל
מחקר
2 דקות

PatientVLM פוגש DocVLM: דיאלוג AI לאבחון רפואי יעיל

בעידן שבו אבחון רפואי באמצעות AI מתבסס בעיקר על ניתוח תמונות, חסרה עדיין התייחסות לתסמינים שמספקים המטופלים. חוקרים מציגים מסגרת PCDF שמדמה דיאלוג בין DocVLM ל-PatientVLM ומשפרת דיוק. קראו עכשיו על הפריצה הזו!

DocVLMPatientVLMPCDF
קרא עוד
Medical SAM3: מודל בסיסי חדש לסגמנטציה מבוססת פרומפטים בהדמיה רפואית
מחקר
2 דקות

Medical SAM3: מודל בסיסי חדש לסגמנטציה מבוססת פרומפטים בהדמיה רפואית

בעולם הרפואה הדיגיטלית, Medical SAM3 פותר אתגרי סגמנטציה בהדמיה רפואית עם כוונון מלא על 33 מערכי נתונים. שיפורים משמעותיים במקרים מורכבים. קראו עכשיו על המודל שמשנה את כללי המשחק.

Medical SAM3SAM3AIM-Research-Lab
קרא עוד