NSED: תערובת מודלים מאחדת סוכני AI קטנים לעוצמה גדולה
מחקר

NSED: תערובת מודלים מאחדת סוכני AI קטנים לעוצמה גדולה

פרוטוקול חדשני מאפשר למודלים קטנים מתחת ל-20B להתעלות על מודלים ענקיים של 100B+ בביצועים ובבטיחות

2 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • פרוטוקול NSED יוצר מודלים מורכבים מסוכנים הטרוגניים באמצעות מתווך דינמי.

  • התלבטות כ-RNN מאקרו עם שער שכחה מאפשרת חידוד ללא הגדלת זיכרון.

  • מודלים <20B עולים על 100B+ באתגרי AIME ו-LiveCodeBench.

  • תיקון עמיתים משפר בטיחות ומפחית סיכונים.

NSED: תערובת מודלים מאחדת סוכני AI קטנים לעוצמה גדולה

  • פרוטוקול NSED יוצר מודלים מורכבים מסוכנים הטרוגניים באמצעות מתווך דינמי.
  • התלבטות כ-RNN מאקרו עם שער שכחה מאפשרת חידוד ללא הגדלת זיכרון.
  • מודלים <20B עולים על 100B+ באתגרי AIME ו-LiveCodeBench.
  • תיקון עמיתים משפר בטיחות ומפחית סיכונים.
בעידן שבו מודלי AI ענקיים דורשים משאבי חומרה אדירים, חוקרים מציגים את פרוטוקול NSED – תערובת-מודלים (MoM) שיוצרת מודלים מורכבים מתוך סוכנים מומחים שונים. הפרוטוקול הזה שובר את התלות בשערי קבועים כמו ב-MoE מסורתי ומשתמש במתווך מומחיות דינמי שמטפל בבחירת מודלים כווריאציה של בעיית התרמיל, בהתבסס על טלמטריה חיה ומגבלות עלות. זה מאפשר אופטימיזציה בזמן אמת שמקצה תפקידים פונקציונליים לצ'קפוינטים הטרוגניים. בשכבת הביצוע, NSED מפורמל את ההתלבטות כרשת נוירונים רקורנטית (RNN) בקנה מידה מאקרו, שבה מצב הקונצנזוס חוזר דרך שער שכחה סמנטי לאפשר חידוד איטרטיבי ללא הגדלת VRAM פרופורציונלית. הרכיבים המרכזיים כוללים בד תזמורת לביקורת עמיתים ללא אמון N-to-N, פונקציית הפעלה של הצבעה ריבועית לקונצנזוס לא-ליניארי, ועדכון מצב מונע משוב. הפרוטוקול הזה יוצר יעילות חומרה חדשה ומאפשר שימוש במודלים צרכניים קטנים. בדיקות אמפיריות על אתגרי AIME 2025 ו-LiveCodeBench מראות כי אנсамבלים של מודלים קטנים (פחות מ-20B פרמטרים) תואמים או עולים על ביצועי מודלים מתקדמים של 100B+ פרמטרים. בנוסף, בדיקות על חבילת הבטיחות DarkBench חושפות תכונות יישור פנימיות, כאשר תיקון על ידי עמיתים מפחית ציוני סיקופנטיה מתחת לרמת כל סוכן בודד. זה מציב גבול יעילות חדש. המשמעות העסקית של NSED היא עצומה: חברות ישראליות בתחום ה-AI יכולות כעת לבנות מערכות חזקות ללא השקעה במערכות יקרות. בהשוואה ל-MoE סטטי, הגישה הדינמית מאפשרת התאמה טובה יותר למשימות ספציפיות ומפחיתה עלויות תפעול. זה פותח דלתות לאוטומציה מתקדמת בעסקים, במיוחד בסביבות עם מגבלות חומרה. מה זה אומר למנהלי עסקים? NSED מציע ארביטראז' חומרה שמאפשר תחרותיות עם מודלים גדולים בעלויות נמוכות. כדאי לבחון שילוב שלו בפרויקטי AI פנימיים כדי לשפר ביצועים ובטיחות. האם הגיע הזמן לשדרג את תשתית ה-AI שלכם?

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

המידע שתמסור ישמש ליצירת קשר ומתן שירותים. למידע נוסף ראה מדיניות פרטיות ותנאי שימוש

עוד כתבות שיעניינו אותך

לכל הכתבות
כמה שכיחים דפוסי החלשה בצ'טבוטי AI?
מחקר
2 דקות

כמה שכיחים דפוסי החלשה בצ'טבוטי AI?

האם סיפורי הזוועה על צ'טבוטי AI שמובילים משתמשים לפעולות מזיקות הם מקרים בודדים או בעיה נפוצה? אנתרופיק בדקה 1.5 מיליון שיחות עם קלוד. קראו עכשיו את הניתוח המלא.

AnthropicClaudeUniversity of Toronto
קרא עוד
Table-BiEval: הערכת מבנה ב-LLM ללא בני אדם
מחקר
2 דקות

Table-BiEval: הערכת מבנה ב-LLM ללא בני אדם

מודלי שפה גדולים מתקשים בתרגום שפה טבעית למבנים מדויקים. Table-BiEval, מסגרת חדשה ללא בני אדם, חושפת חולשות ומפתיעה: מודלים בינוניים מנצחים ענקיים. קראו עכשיו על הפריצה הזו!

Table-BiEvalLLMs
קרא עוד