מה זה COffeE-PSRO במילים פשוטות?

COffeE-PSRO הוא מנגנון מחקרי לפתרון משחקים מרובי סוכנים כשעובדים רק עם מאגר נתונים קבוע. במקום לבדוק כל אסטרטגיה בעולם האמיתי, הוא מנסה להעדיף אסטרטגיות שסביר יותר שיניבו חרטה נמוכה. לעסק, זה דומה לבחינת תסריטי שירות או מכירה על 1,000 שיחות עבר לפני שמפעילים אותם מול לקוחות אמיתיים.

איך זה יכול לעזור לעסק ישראלי שלא עוסק במחקר?

גם אם אינכם מפתחים אלגוריתמים, הרעיון שימושי מאוד. אפשר לקחת היסטוריית לידים, שיחות WhatsApp, סטטוסים ב-Zoho CRM ונתוני סגירה, ולבחון איזו מדיניות תגובה נראית יציבה יותר לפני פריסה. בענפים כמו נדל"ן, ביטוח ומרפאות פרטיות, בדיקה כזו יכולה לחסוך שבועות של ניסוי וטעייה ולהפחית טעויות יקרות מעל ₪5,000 לעסקה.

כמה עולה ליישם גישה שמבוססת על נתוני עבר ואוטומציה?

ברוב ה-SMBs בישראל, פיילוט ראשון יעלה פחות מפרויקט AI מלא. חיבור בסיסי בין WhatsApp Business API, מערכת CRM כמו Zoho וזרימות N8N יכול להתחיל סביב ₪3,000–₪8,000 להקמה, ועוד מאות או אלפי שקלים בחודש. העלות תלויה ב-3 גורמים: נפח הודעות, מורכבות האינטגרציות, ורמת האוטונומיה של סוכן ה-AI.

מחקר

למידת חיזוק מרובת סוכנים ללא דאטה חדש: למה COffeE-PSRO חשוב

מחקר חדש מ-arXiv מציע דרך לבחור שיווי משקל בסביבה לא מקוונת — עם השלכות על סימולציות, תמחור וסוכני AI

צוות אוטומציות AI

8 במרץ 2026

6 דקות קריאה

מבוסס על כתבה שלarXiv cs.AI ↗תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

נקודות עיקריות

המחקר מציג את COffeE-PSRO, הרחבה ל-PSRO שמנסה למצוא פתרונות עם חרטה נמוכה יותר תחת דאטה חלקי.
לפי התקציר, השיטה פועלת באוף־ליין מלא: מאגר נתונים קבוע של מסלולי מצב־פעולה, בלי איסוף אינטראקציות חדשות.
לעסקים בישראל זה רלוונטי לתהליכים כמו תמחור, קביעת פגישות ושירות ב-WhatsApp, שבהם טעות אחת יכולה לעלות ₪5,000 ומעלה.
פיילוט יישומי יכול להתחיל בטווח של ₪3,000–₪8,000 להקמה, עם חיבור בין WhatsApp Business API, Zoho CRM ו-N8N.
המסר המרכזי: לפני אוטונומיה מלאה, כדאי להפעיל מדיניות שמרנית ולבדוק אסטרטגיות על נתוני עבר במשך 14 יום לפחות.

למידת חיזוק מרובת סוכנים ללא דאטה חדש: למה COffeE-PSRO חשוב

המחקר מציג את COffeE-PSRO, הרחבה ל-PSRO שמנסה למצוא פתרונות עם חרטה נמוכה יותר תחת דאטה...
לפי התקציר, השיטה פועלת באוף־ליין מלא: מאגר נתונים קבוע של מסלולי מצב־פעולה, בלי איסוף אינטראקציות...
לעסקים בישראל זה רלוונטי לתהליכים כמו תמחור, קביעת פגישות ושירות ב-WhatsApp, שבהם טעות אחת יכולה...
פיילוט יישומי יכול להתחיל בטווח של ₪3,000–₪8,000 להקמה, עם חיבור בין WhatsApp Business API, Zoho...
המסר המרכזי: לפני אוטונומיה מלאה, כדאי להפעיל מדיניות שמרנית ולבדוק אסטרטגיות על נתוני עבר במשך...

למידת חיזוק מרובת סוכנים באוף־ליין: למה זה חשוב עכשיו

למידת חיזוק מרובת סוכנים באוף־ליין היא גישה שבה מאמנים סוכנים על מאגר נתונים קבוע, בלי לאסוף אינטראקציות חדשות, כדי למצוא אסטרטגיות קרובות לשיווי משקל. לפי המאמר החדש ב-arXiv, דווקא תחת המגבלה הזו אפשר לשפר את הסיכוי לפתרון עם חרטה נמוכה באמצעות COffeE-PSRO.

עבור עסקים ישראליים, זו לא שאלה אקדמית בלבד. כשאין אפשרות “לנסות על לקוחות” אלפי וריאציות של תמחור, שירות או מו"מ, ארגונים נאלצים לעבוד עם נתוני עבר בלבד. לפי McKinsey, ארגונים שמטמיעים בינה מלאכותית בתהליכי ליבה מחפשים יותר ויותר שימושים שבהם עלות הטעות בזמן אמת גבוהה במיוחד. כאן בדיוק נכנסת למידת חיזוק לא מקוונת: היא מאפשרת לבחון אסטרטגיה על בסיס לוגים, הקלטות וטרנזקציות קיימות, במקום להריץ ניסויים מסוכנים בפרודקשן.

מה זה גילוי שיווי משקל שמרני?

גילוי שיווי משקל שמרני הוא שיטה לחיפוש אסטרטגיות במשחק רב־סוכנים כאשר אי אפשר לבדוק את כל דינמיקת המערכת בפועל. בהקשר עסקי, המשמעות היא שלא מחפשים רק “אסטרטגיה טובה”, אלא אסטרטגיה שסביר יותר שתישאר יציבה גם כשהמידע חלקי. לדוגמה, אם חברת ביטוח ישראלית בוחנת תגובות של נציגי מכירות ושל לקוחות להצעות מחיר, היא תרצה לבחור מדיניות שמפחיתה חרטה צפויה, ולא רק כזו שנראית טובה על מדגם צר. זה רלוונטי במיוחד כאשר בסיס הנתונים כולל אלפי אינטראקציות אך אינו מכסה את כל המצבים האפשריים.

מה מציג המחקר החדש של COffeE-PSRO

לפי התקציר שפורסם עבור המאמר "Conservative Equilibrium Discovery in Offline Game-Theoretic Multiagent Reinforcement Learning", החוקרים עוסקים בפתרון משחקים בסביבה של offline learning, כלומר תחת מגבלה של מאגר מסלולי מצב־פעולה קבוע. במקום להניח שאפשר לאמת אם פתרון מוצע הוא שיווי משקל אמיתי, המאמר מציע להעריך את ההסתברות היחסית לחרטה נמוכה בין כמה מועמדים, לפי המידע הזמין בלבד. זו נקודה חשובה: במערכות מורכבות, הדאטה מכסה לעיתים רק חלק קטן מדינמיקת המשחק, ולכן אימות מלא פשוט אינו אפשרי.

החוקרים מרחיבים את PSRO — קיצור של Policy Space Response Oracles — שנחשב גישה מקוונת לפתרון משחקים, ומוסיפים לו רכיב של כימות אי־ודאות בדינמיקת המשחק. בנוסף, הם משנים את פונקציית המטרה של למידת החיזוק כך שתעדיף פתרונות שסביר יותר כי יניבו חרטה נמוכה במשחק האמיתי. לצד זאת, הם מציעים meta-strategy solver חדש שמותאם ספציפית לאוף־ליין ומכוון את חקר האסטרטגיות בתוך PSRO. לפי הדיווח, החיבור בין עקרונות שמרנות מעולם Offline RL לבין חקר אסטרטגיות הוא הבסיס לשם COffeE-PSRO.

מה נטען לגבי הביצועים

לפי התקציר, הניסויים הראו כי COffeE-PSRO הצליח להפיק פתרונות עם חרטה נמוכה יותר לעומת גישות offline עדכניות אחרות. מעבר לכך, המחקר מדווח על קשרים בין רכיבי האלגוריתם, רמת הנאמנות של המשחק האמפירי, והביצועים הכוללים. חשוב להדגיש: בתקציר אין מספרים מוחלטים, שיעורי שיפור או פירוט של מערכי הניסוי, ולכן אי אפשר להסיק ממנו לבדו בכמה אחוזים השיטה טובה יותר. אבל כן אפשר להבין את התרומה המושגית: במקום “להעמיד פנים” שהדאטה מספיק כדי לדעת את כללי המשחק המלאים, השיטה בונה מנגנון בחירה שמכיר במגבלות הידע.

ההקשר הרחב: למה אוף־ליין AI הופך למרכזי

המגמה הזו מתחברת לכיוון רחב יותר בעולם הבינה המלאכותית. לפי Gartner, עד 2026 חלק גדל מהטמעות ה-AI הארגוניות יתמקד בממשל מודלים, בקרת סיכון ושימוש בנתונים קיימים במקום בניסויי אונליין אגרסיביים. גם ביישומים מסחריים, ארגונים מעדיפים לעבוד קודם על היסטוריית CRM, שיחות שירות, תכתובות WhatsApp ולוגים תפעוליים לפני שמחברים אוטומציה ישירות ללקוח. במובן הזה, COffeE-PSRO אינו רק אלגוריתם למחקר תיאורטי; הוא משקף שינוי עמוק: מעבר מהבטחה של “נלמד בזמן אמת” לגישה שמרנית יותר, שמתאימה לסביבות שבהן שגיאה אחת יכולה לעלות באובדן לקוח, חשיפה רגולטורית או פגיעה במוניטין.

ניתוח מקצועי: מה המשמעות האמיתית של COffeE-PSRO

מניסיון בהטמעה אצל עסקים ישראליים, הבעיה המרכזית כמעט אף פעם אינה מחסור במודלים אלא מחסור ביכולת לבדוק אסטרטגיה חדשה בלי לשלם מחיר עסקי. המשמעות האמיתית כאן היא שהמחקר נותן שפה מתמטית מסודרת לבעיה שמנהלי תפעול ומכירות מכירים היטב: איך בוחרים מדיניות כשהדאטה חלקי והעולם האמיתי מעניש מהר. אם מתרגמים את זה לעולמות יישומיים, אפשר לחשוב על סוכן AI שמנהל שיחות ראשוניות ב-WhatsApp, בעוד מערכת Zoho CRM אוספת היסטוריה של תגובות, המרות וזמני טיפול, ו-N8N מתזמן זרימות עבודה בין הערוצים. במערכת כזו יש לפחות 3 שחקנים עם אינטרסים שונים: העסק, הלקוח והמערכת האוטומטית עצמה.

במצבים כאלה, “האסטרטגיה הטובה ביותר” על הנייר עלולה להיות מסוכנת אם היא נשענת על אזורים בדאטה שלא נצפו מספיק. לכן הגישה השמרנית שמעדיפה מועמדים עם סבירות גבוהה יותר לחרטה נמוכה היא לא רק סבירה — היא לעיתים הדרך היחידה לפרוס מערכת בלי להגדיל סיכון. ההערכה שלי היא שב-12 עד 24 החודשים הקרובים נראה יותר כלים מסחריים שמאמצים לוגיקה דומה: פחות אופטימיזציה אגרסיבית, יותר בחירה זהירה של מדיניות תחת אי־ודאות. עבור מי שבונה סוכני AI לעסקים או מחבר מערכות תפעול ומכירה, זהו כיוון שצריך לעקוב אחריו מקרוב.

ההשלכות לעסקים בישראל

היישום המיידי ביותר בישראל אינו בהכרח “פתרון משחקים” במובן האקדמי, אלא ניהול אינטראקציות עם כמה גורמים שמגיבים זה לזה. במשרדי עורכי דין, למשל, אפשר לנתח בדיעבד אלפי פניות נכנסות, תגובות של צוות הקליטה והסתברות לקביעת פגישה. במרפאות פרטיות, אפשר לבחון איך מטופלים מגיבים להזכרת תור, להצעת תור חלופי או לבקשת מסמכים. בסוכנויות ביטוח ובנדל"ן, המערכת מתמודדת עם מו"מ, רגישות למחיר, זמני תגובה ותחרות. בכל אחד מהמקרים האלה, אין רצון “לשחק” בזמן אמת עם תסריטים לא בדוקים על לקוחות אמיתיים.

מבחינת רגולציה, עסקים בישראל צריכים להביא בחשבון את חוק הגנת הפרטיות, הרשאות עיבוד מידע, ושמירה על תיעוד מסודר כאשר מאמנים מערכות על שיחות עבר. בנוסף, עבודה בעברית מייצרת מורכבות נוספת: סלנג, קיצורים, שגיאות כתיב, ושילוב בין עברית לאנגלית בתוך WhatsApp. לכן, לפני שמיישמים מודל אסטרטגי, כדאי לנקות נתונים ולמפות מקורות: CRM, מרכזייה, טפסים, WhatsApp Business API ויומני פעילות. פרויקט פיילוט בסיסי שמחבר מערכת CRM חכמה עם N8N וערוץ WhatsApp יכול להתחיל סביב ₪3,000–₪8,000 להקמה ראשונית, ולאחר מכן עלויות חודשיות של מאות עד אלפי שקלים, תלוי בנפח ההודעות, בלוגיקת האוטומציה ובמודלי ה-AI שנבחרים.

זו גם הנקודה שבה הייחוד של Automaziot AI בולט: החיבור בין AI Agents, ‏WhatsApp Business API, ‏Zoho CRM ו-N8N מאפשר לא רק לאסוף נתונים אלא לבנות לולאת למידה מבוקרת. במקום להמר על מערכת אחת “יודעת כל”, אפשר להפעיל שכבה של אוטומציה שמרנית: לתעד, לנתח, לדרג סיכון ורק אז לפתוח אוטונומיה מלאה. לעסקים קטנים ובינוניים בישראל זו לעיתים דרך ריאלית יותר מאשר מעבר חד למערכת אוטונומית מלאה ביום אחד.

מה לעשות עכשיו: צעדים מעשיים לעסק ישראלי

מפו בתוך 7 ימים אילו מקורות נתונים כבר קיימים אצלכם: Zoho, Monday, HubSpot, WhatsApp Business, טפסי לידים ומערכת טלפוניה.
בחרו תהליך אחד בלבד לפיילוט של שבועיים, למשל קביעת פגישות או מענה ראשוני ללידים, ובדקו אם אפשר להריץ סימולציה על נתוני עבר לפני מגע עם לקוחות.
חברו את המערכות דרך N8N או API ייעודי, כדי לתעד החלטות, תוצאות וחריגות ברמת אירוע בודד.
הגדירו סף סיכון ברור: מתי סוכן AI פועל אוטומטית, ומתי הוא מעביר לנציג אנושי. זה קריטי במיוחד אם העלות של טעות אחת היא אובדן עסקה של ₪5,000 ומעלה.

מבט קדימה על למידת חיזוק אוף־ליין לעסקים

המחקר על COffeE-PSRO עדיין אקדמי, אבל הרעיון שהוא מחדד כבר רלוונטי מאוד לשוק: כשאין לכם אפשרות לאסוף אינסוף ניסויים חיים, אתם צריכים לבחור אסטרטגיות שמרניות יותר תחת אי־ודאות. בחודשים הקרובים כדאי לעקוב אחרי כלים שיחברו בין AI Agents, ‏WhatsApp, ‏CRM ו-N8N בצורה מדידה ומבוקרת. מי שיבנה היום תשתית נתונים טובה, יוכל מחר להפעיל אוטומציה עם פחות סיכון ועם שליטה עסקית טובה יותר.

שאלות ותשובות

שאלות נפוצות

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של arXiv cs.AI. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־arXiv cs.AI

כל הכתבות מ־arXiv cs.AI

ספקולטיב דיקודינג במובייל: למה AHASD משנה את המשחק

מחקר

30 באפריל 2026

6 דקות

מ־arXiv cs.AI

ספקולטיב דיקודינג במובייל: למה AHASD משנה את המשחק

**ספקולטיב דיקודינג במובייל הוא דרך להאיץ הרצת מודלי שפה גדולים על מכשירי קצה באמצעות מודל קטן שמכין טיוטה ומודל גדול שמאמת אותה.** במחקר AHASD שפורסם ב-arXiv החוקרים מדווחים על עד פי 4.2 בתפוקה ופי 5.6 ביעילות אנרגטית לעומת בסיס GPU בלבד, עם תקורת חומרה של פחות מ-3% משטח ה-DRAM. עבור עסקים בישראל, המשמעות היא אפשרות עתידית להעביר חלק ממשימות ה-AI למובייל — למשל סיכום שיחות, סיווג פניות והשלמת טפסים — תוך שילוב עם Zoho CRM, ‏WhatsApp Business API ו-N8N. זה עדיין לא מוצר מדף, אבל הכיוון חשוב מאוד לכל ארגון שבונה תהליכי AI מהירים, חסכוניים ורגישים לפרטיות.

Draft Language Model Target Language Model NPU

קרא עוד

Auto-ARGUE להערכת דוחות RAG: למה זה חשוב לעסקים

מחקר

30 באפריל 2026

5 דקות

מ־arXiv cs.AI

Auto-ARGUE להערכת דוחות RAG: למה זה חשוב לעסקים

**Auto-ARGUE הוא כלי להערכת דוחות RAG עם ציטוטים, שנועד לבדוק אם מסמך שנוצר בידי מודל שפה אכן נשען על מקורות נכונים וניתנים לאימות.** לפי התקציר ב-arXiv, החוקרים בחנו אותו על משימות TREC 2024 ומצאו מתאם טוב ברמת המערכת מול שיפוט אנושי. עבור עסקים בישראל, המשמעות ברורה: אם אתם מייצרים סיכומי לידים, תקצירי תיקים, דוחות שירות או מסמכי הנהלה באמצעות מודלי שפה, אתם צריכים שכבת בקרה ולא רק שכבת יצירה. השילוב בין AI Agents,‏ WhatsApp Business API,‏ Zoho CRM ו-N8N יכול לספק תהליך עבודה חזק, אבל בלי מדידת איכות לדוחות עצמם, הסיכון לטעויות עסקיות נשאר גבוה.

TREC 2024 NeuCLIR RAG

קרא עוד

מחקר

28 באפריל 2026

6 דקות

מ־arXiv cs.AI

אופטימיזציית העדפות ללא Likelihood Displacement: מה המחקר משנה

**Likelihood Displacement הוא מצב שבו אימון מודל שפה להעדפות פוגע גם בתשובה הטובה, לא רק בגרועה.** המחקר החדש ב-arXiv מציע מסגרת בשם disentanglement band ושכבת Reward Calibration שמטרתן לשמור על התשובה המועדפת תוך דיכוי התשובה שנדחתה. עבור עסקים בישראל, המשמעות פרקטית מאוד: אם אתם מפעילים סוכן ב-WhatsApp, מחברים אותו ל-Zoho CRM ומנהלים תהליכים דרך N8N, כוונון שגוי עלול לפגוע בשירות, במכירות ובאיכות מיון הלידים. לכן המדד הנכון אינו רק "האם המודל פחות טועה", אלא גם "האם הוא ממשיך לענות היטב במקרים הטובים".

GitHub Reward Calibration disentanglement band

קרא עוד

גרין פרומפטינג ל-LLM: איך ניסוח השאלה משפיע על עלות

מחקר

28 באפריל 2026

6 דקות

מ־arXiv cs.AI

גרין פרומפטינג ל-LLM: איך ניסוח השאלה משפיע על עלות

**גרין פרומפטינג הוא שיטה לניסוח פרומפטים שמפחיתה עלות הרצה של מודלי שפה דרך שינוי המשמעות של המשימה, לא רק קיצור הטקסט.** לפי מחקר arXiv חדש, אורך הפרומפט פחות משמעותי מהסמנטיקה שלו, ומילים מסוימות עשויות להעלות או להוריד צריכת אנרגיה. עבור עסקים בישראל, המשמעות מעשית: אם אתם מחברים LLM ל-WhatsApp, ל-Zoho CRM או לזרימות N8N, ניסוח מדויק יותר יכול לשפר זמן תגובה ולצמצם עלויות API וחישוב. המסקנה המרכזית היא שלא כל תהליך צריך תשובה פתוחה; לעיתים סיווג קצר ומובנה ייתן תוצאה עסקית טובה יותר במחיר נמוך יותר.

OpenAI Anthropic Google

קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות

SymptomAI: סוכן בינה מלאכותית שיחתי להערכת סימפטומים רפואיים

מחקר

לפני 6 ימים

5 דקות

מ־Google Research

SymptomAI: סוכן בינה מלאכותית שיחתי להערכת סימפטומים רפואיים

מחקר לאומי ראשון מסוגו שנערך על ידי Google Research בוחן את ביצועיו של SymptomAI – מערך סוכני בינה מלאכותית שיחתיים מבוססי Gemini Flash 2.0 המיועדים לראיונות סימפטומים והערכת אבחנה מבדלת (DDx). המחקר, שהקיף 13,917 משתתפים, השווה את האבחנות המבדלות שהפיק הסוכן אל מול הערכות של פאנל רופאים מומחים ודיווחים מביקורים רפואיים בעולם האמיתי. הממצאים מראים כי קלינאים העדיפו את אבחנות הסוכן בלמעלה מ-50% מהמקרים, וכי דיוק המערכת השתפר משמעותית באמצעות אסטרטגיות הנחיה אקטיביות. בנוסף, המחקר הדגים מתאם מובהק בין אבחנות המערכת לבין שינויים באותות פיזיולוגיים שנמדדו במכשירי פיטביט לבישים.

Google DeepMind Joseph Breda Jake Sunshine

קרא עוד

פער ההערכה של סוכני AI: פריסה לייצור למרות כשלים מול לקוחות

מחקר

17 ביולי 2026

4 דקות

מ־VentureBeat

פער ההערכה של סוכני AI: פריסה לייצור למרות כשלים מול לקוחות

מחקר חדש של VentureBeat Pulse Research חושף כי קיים פער עמוק בין האוטונומיה המוענקת לסוכני AI לבין האמון במערכות הבדיקה שלהם. מחצית מהארגונים שנשאלו כבר השיקו סוכן שעבר את ההערכות הפנימיות אך כשל בפני לקוח בסביבת הייצור, ורק 5% סומכים באופן מלא על הערכות אוטומטיות כיום. למרות זאת, 66% מהארגונים מאפשרים או פועלים לאפשר פריסה אוטומטית לחלוטין ללא מעורבות אנושית. השוק מבוזר מאוד ורבים מתכננים להחליף פלטפורמות בשנה הקרובה.

OpenAI Anthropic DeepEval

קרא עוד

אורקסטרציה של סוכני בינה מלאכותית בארגונים: פער בין שאיפות למציאות

מחקר

16 ביולי 2026

5 דקות

מ־VentureBeat

אורקסטרציה של סוכני בינה מלאכותית בארגונים: פער בין שאיפות למציאות

סקר חדש של VentureBeat Pulse Research מיוני 2026 חושף פער עמוק בארגונים בין השאיפות לניהול סוכני בינה מלאכותית (AI) לבין המציאות בשטח. לפי הסקר, שנערך בקרב 101 ארגונים, קיים תהליך התגבשות סביב פלטפורמות של ספקי מודלים, ובראשן Claude של Anthropic (המובילה עם 40% מההטמעות), בעוד הבחירה מונעת מ'כוח המשיכה' של מודל הבסיס. עם זאת, בעוד ארגונים מגדירים הצלחה לפי ביצוע אמין של תהליכים מרובי-שלבים, 71% מהם מדווחים בכנות כי רבע או פחות מהסוכנים המוטמעים שלהם בפועל הם אכן מרובי-שלבים, ומרביתם הם רק מעטפות צ'אטבוט פשוטות. בנוסף, 27% מהארגונים חסרים בקרה פיננסית בזמן אמת על עלויות צריכת האסימונים של הסוכנים.

Anthropic Claude Microsoft

קרא עוד

מחקר

16 ביולי 2026

4 דקות

מ־Google Research

כיצד נוצרת היצירתיות של מודלי דיפוזיה? מחקר של Google Research

בפוסט חדש מטעם Google Research, מדען המחקר ג'נגדאו צ'ן מציג ממצאים מתוך מאמר שהתקבל לוועידת ICLR 2026, המפענח את מקור ה'יצירתיות' של מודלי דיפוזיה. לפי המחקר, היכולת של המודלים הללו לייצר נתונים חדשים, במקום לשנן באופן עיוור את מאגר האימון שלהם, היא תוצאה מתמטית של תהליך החלקת פונקציית הציון (score smoothing). החלקה זו נגרמת באופן טבעי בשל השפעות רגולריזציה במהלך אימון הרשתות העצביות, המונעות מהן ללמוד פונקציות בעלות מעברים חדים במיוחד. כתוצאה מכך, המודל מייצר אינטרפולציה במרווחים שבין נקודות המידע המקוריות של האימון. בסביבה רב-ממדית, אפקט זה פועל בכיוונים המשיקים ליריעת הנתונים הנסתרת, וכך מאפשר להשיג איזון מדויק בין איכות הנתונים לבין היצירתיות שלהם.

Zhengdao Chen ICLR 2026 AdamW

קרא עוד