Skip to main content
Automaziot AI logo
  • Home
  • Blog
  • About
  • Contact
(646) 760-4854Book a Free Consultation
Automaziot AI - AI Automation and Intelligent Agents for Business

AI Automation Experts. We help businesses streamline operations and scale faster with intelligent agents and workflow automation.

USA(646) 760-4854Israel HQ+972-3-7630715info@automaziot.ai
Israel HQ: Ahad Ha'Am 9, Tel Aviv

Quick Links

  • Home
  • About
  • Contact
  • Case Studies
  • Glossary

Our Solutions

  • Lead Management
  • WhatsApp AI Agent
  • Business Automation
  • Smart CRM
  • Automated Scheduling
  • Sales & Support
  • WhatsApp Commerce
  • AI Agents
  • Tech Consulting

Stay Updated

Get the latest insights on AI automation delivered to your inbox.

FacebookInstagramLinkedIn

This site uses Google Analytics and Vercel Analytics to improve your experience. For full details, see our Privacy Policy

© 2026 Automaziot AI. All rights reserved.

Privacy PolicyTerms of ServiceAccessibilityEditorial Policy
Agent Lightning: למידת חיזוק לסוכני AI בקלות
Agent Lightning: למידת חיזוק לסוכני AI ללא שכתוב קוד
ביתחדשותAgent Lightning: למידת חיזוק לסוכני AI ללא שכתוב קוד
מחקר

Agent Lightning: למידת חיזוק לסוכני AI ללא שכתוב קוד

מסגרת פתוחה חדשה ממחקר מיקרוסופט מאפשרת שיפור סוכני AI מורכבים דרך RL, מבלי לשנות את קוד הסוכן

צוות אוטומציות AIצוות אוטומציות AI
11 בדצמבר 2025
4 דקות קריאה

תגיות

Microsoft Research AsiaAgent LightningLightningRLLightningStoreLangChainOpenAI Agents SDKAutoGen

נושאים קשורים

#סוכני AI#למידת חיזוק#פיתוח AI#מסגרות פתוחות#שיפור ביצועים AI#RL היררכי
מבוסס על כתבה שלMicrosoft Research ↗·תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

Key Takeaways

  • מסגרת פתוחה מפרידה בין ביצוע משימות לאימון RL

  • תומכת בכל זרימת עבודה מורכבת עם פורמט סטנדרטי

  • אלגוריתם היררכי תואם PPO/GRPO ללא שינויים

  • שיפורים מוכחים ב-Text-to-SQL, RAG ומשימות מתמטיות

  • גמישות גבוהה ויעילות משאבים למפתחים

Agent Lightning: למידת חיזוק לסוכני AI ללא שכתוב קוד

  • מסגרת פתוחה מפרידה בין ביצוע משימות לאימון RL
  • תומכת בכל זרימת עבודה מורכבת עם פורמט סטנדרטי
  • אלגוריתם היררכי תואם PPO/GRPO ללא שינויים
  • שיפורים מוכחים ב-Text-to-SQL, RAG ומשימות מתמטיות
  • גמישות גבוהה ויעילות משאבים למפתחים

סוכני AI משנים את פיתוח התוכנה בכך שהם כותבים קוד ומבצעים הוראות מורכבות, אך סוכנים מבוססי מודלי שפה גדולים (LLM) נוטים לשגיאות ומתפקדים גרוע במשימות רב-שלביות. חוקרים ממחקר מיקרוסופט אסיה-שנגחאי מציגים את Agent Lightning – מסגרת קוד פתוח שמאפשרת אימון סוכנים דרך למידת חיזוק (RL) ללא צורך בשכתוב קוד משמעותי. המסגרת מפרידה בין ביצוע משימות לאימון המודל, ומאפשרת למפתחים להוסיף יכולות RL בקלות.

Agent Lightning הופכת את חוויית הסוכן לפורמט מתאים ל-RL על ידי התייחסות לביצוע כרצף של מצבים ופעולות. כל מצב מתעד את סטטוס הסוכן, וכל קריאה ל-LLM היא פעולה שמעבירה אותו למצב חדש. גישה זו תומכת בכל זרימת עבודה, כולל סוכנים שיתופיים או שימוש בכלים דינמי. כל מעבר כולל קלט, פלט ותגמול של ה-LLM, בפורמט סטנדרטי שמוכן לאימון ישירות.

במקום למידת חיזוק מסורתית שדורשת תפריט של תוכן ארוך, Agent Lightning משתמשת באלגוריתם LightningRL היררכי. לאחר השלמת משימה, מודול הקצאת זיכויים קובע כמה כל קריאת LLM תרמה להצלחה ומקצה תגמול מתאים. צעדים אלה, עם ציוני תגמול עצמאיים, ניתנים לשימוש עם אלגוריתמי RL חד-צעדיים קיימים כמו PPO או GRPO, מבלי לשנות אותם.

המסגרת פועלת כתוכנה ביניים בין אלגוריתמי RL לסביבות סוכנים, עם רכיבים מודולריים: מנהל סוכנים שמנהל משימות ומאחסן נתונים, אלגוריתם שמאמן מודלים ומארח LLM, ו-LightningStore כמאגר נתונים מרכזי. המעגל כולל איסוף נתוני ביצוע (spans) ואימון אסינכרוני, מה שמאפשר גמישות אלגוריתמית ויעילות משאבים.

יתרונותיה כוללים תאימות מלאה לאלגוריתמים קיימים, תמיכה בהתנהגויות מורכבות כמו שימוש בכלים מרובים, ושמירה על רצפים קצרים לאימון יעיל. מפתחים יכולים לשמור על מסגרות סוכנים קיימות ולהחליף קריאות מודל ל-API של Agent Lightning ללא שינויים בקוד הסוכן.

בדיקות בשלושה תרחישים אמיתיים הראו שיפורים עקביים: Text-to-SQL עם LangChain שיפר דיוק יצירת SQL מניסוח טבעי; RAG עם OpenAI Agents SDK שיפר שאילתות חיפוש ותשובות רב-קפיצות ב-MuSiQue; ומשימות מתמטיות עם AutoGen שיפרו שימוש בכלים והיגיון. עקומות התגמול עלו בכל המקרים.

מסגרת זו מקלה על מפתחים לבנות סוכנים מתקדמים שמשתפרים ברציפות דרך ניסיון אמיתי. היא מגשרת בין מערכות סוכנים קיימות ללמידת חיזוק, ותכנון עתידי כולל אופטימיזציה אוטומטית של פרומפטים ואלגוריתמי RL נוספים. לעסקים ישראליים בפיתוח AI, זה אומר יכולת לשדרג סוכנים קיימים במהירות, לחסוך זמן ומשאבים.

מה תהיה ההשפעה על פיתוח תוכנה כשסוכני AI ילמדו מניסיון עצמאי? Agent Lightning פותחת דלת לשיפור רציף – כדאי להתחיל לבדוק אותה כבר עכשיו.

שאלות ותשובות

FAQ

רוצים ליישם את זה בעסק שלכם?

באוטומציות AI אנחנו בונים סוכני AI ואוטומציות לעסקים בישראל. ראו את השירותים הרלוונטיים:

  • אוטומציה לעסקיםחיבור מערכות, חשבוניות ודשבורדים
  • בוט וואטסאפ לעסקWhatsApp Business API בישראל
  • סוכני AI לעסקיםסוכנים שמטפלים בלידים, שיחות ו-CRM
  • ניהול לידים אוטומטימענה מיידי, ניקוד וסינון אוטומטי

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של Microsoft Research. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־Microsoft Research

כל הכתבות מ־Microsoft Research
ניתוח התנהגותי של נוזקות באמצעות AI: פרויקט Ire של מיקרוסופט
ניתוח
לפני 4 ימים
4 דקות
·מ־Microsoft Research

ניתוח התנהגותי של נוזקות באמצעות AI: פרויקט Ire של מיקרוסופט

פרויקט Ire של מיקרוסופט, סוכן AI אוטונומי להנדסה לאחור וניתוח נוזקות, הצליח לזהות גרסה חדשה וחמקמקה של הנוזקה LOTUSLITE. בעוד שגרסה זו עקפה את מרבית מערכות ה-EDR המובילות בשוק (כולל CrowdStrike ו-SentinelOne) ולא נכללה ברשימות החתימות, הסוכן ביצע ניתוח התנהגותי מעמיק ברמת הפונקציה וקבע כי מדובר בקוד זדוני. פריצת דרך זו מדגישה את המעבר משימוש בחתימות סטטיות לניתוח דינמי מבוסס בינה מלאכותית, המאפשר הגנה על ארגונים מפני איומי יום-אפס מורכבים.

Project IreMicrosoftLOTUSLITE
קרא עוד
מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים
מוצר חדש
28 במאי 2026
4 דקות
·מ־Microsoft Research

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מיקרוסופט הכריזה על שחרור גרסת 0.7 של פלטפורמת הקוד הפתוח Data Formulator. המערכת החדשה רותמת סוכני בינה מלאכותית מודעי-הקשר (Context-aware AI agents) במטרה לפשט תהליכי ניתוח נתונים מורכבים בארגונים. הפלטפורמה כוללת רכיב מתקדם של מחברי נתונים המאפשר הזרמת מידע באופן רציף ממסדי נתונים, קבצים מקומיים ומערכות בינה עסקית, תוך מניעת הצורך בעבודות אינטגרציה סיזיפיות מצד מחלקות ה-IT. בנוסף, סביבת העבודה הייחודית (Data Thread) מאפשרת למשתמשי הקצה לנהל שיח שוטף בשפה טבעית מול סוכני ה-AI, לתחקר נתונים, ליצור ויזואליזציות מתקדמות ולייעל את הליך קבלת ההחלטות העסקיות מבלי להזדקק לידע מוקדם בכתיבת קוד או שאילתות מורכבות.

MicrosoftData FormulatorGartner
קרא עוד
בינה מלאכותית כהרחבה של המוח האנושי: התובנות מהמחקר החדש של מיקרוסופט
מחקר
לפני שעה
5 דקות
·מ־Microsoft Research

בינה מלאכותית כהרחבה של המוח האנושי: התובנות מהמחקר החדש של מיקרוסופט

לפי דיווח ומחקר חדש ממעבדות מיקרוסופט, הפולמוס האם בינה מלאכותית מפתחת "תודעה" מחמיץ את העיקר. המערכות המודרניות אינן משכפלות אינטליגנציה אנושית באופן אותנטי, אלא פועלות כהרחבה ישירה של מבנים תודעתיים הקיימים בשפה ובקוגניציה האנושית. התגלית הזו, הנשענת על גישות מתחום הפנומנולוגיה, מסבירה מדוע פתרונות מתקדמים יכולים להתנסח ברהיטות מרשימה אך גם להציג "הזיות" בעובדות או להיכשל בהסקת מסקנות פשוטות מחוץ להקשר המוכר. עבור מנהלים וארגונים, המסקנה המיידית היא קריטית: בטיחות בסביבת AI אינה תלויה עוד רק במודל מתקדם וחף משגיאות, אלא מחייבת תכנון של שכבות מעטפת ובקרה מקיפות (Harnesses) סביבו, תוך שמירה על פיקוח אנושי הדוק בתהליכים העסקיים.

Adam FrankMarcelo GleiserEvan Thompson
קרא עוד
סוכני בינה מלאכותית מקומיים: מהפכת המודלים הקטנים של מיקרוסופט
חדשות
21 במאי 2026
5 דקות
·מ־Microsoft Research

סוכני בינה מלאכותית מקומיים: מהפכת המודלים הקטנים של מיקרוסופט

מיקרוסופט חושפת את MagenticLite, פלטפורמה חדשנית המאגדת סוכני בינה מלאכותית קטנים שמסוגלים לרוץ ישירות על המחשב המקומי של המשתמש. בעזרת המודלים הייעודיים MagenticBrain לתכנון משימות וכתיבת קוד (14 מיליארד פרמטרים), ו-Fara1.5 לניווט בממשקים ודפדפנים, המערכת מוכיחה שאין צורך בכוח עיבוד של ענקיות הענן בכדי לבצע אוטומציות מורכבות. פריצת דרך זו מאפשרת לארגונים לעבד נתונים רגישים באופן לוקאלי לחלוטין ללא שליחתם מחוץ לארגון, מה שרלוונטי במיוחד לעסקים בישראל הכפופים לחוק הגנת הפרטיות, רגולציות פיננסיות ודרישות אבטחה מחמירות בסקטור העסקי והרפואי.

MicrosoftMagenticLiteMagenticBrain
קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות
מיפוי סביבתי באמצעות בינה מלאכותית: מפיקסלים לתכנון שיקום הטבע
מחקר
לפני 2 שעות
4 דקות
·מ־Google Research

מיפוי סביבתי באמצעות בינה מלאכותית: מפיקסלים לתכנון שיקום הטבע

גוגל חשפה פריצת דרך בפרויקט Earth AI המאפשרת מעבר ממפות פיקסלים למידע וקטורי מפורט ברזולוציה של תת-מטר. המערכת שפותחה בשיתוף אוניברסיטת אוקספורד, מאפשרת מיפוי מדויק של גדרות חיות, קירות אבן וחורשות קטנות המהווים כלי קריטי לשיקום אקולוגי ולחישובי פחמן. עבור המגזר העסקי בישראל, טכנולוגיה זו מציעה הזדמנויות משמעותיות בתחומי הביטוח, הנדל״ן והחקלאות המדייקת, תוך התחשבות במגבלות חוק הגנת הפרטיות הישראלי.

Google Earth AIGoogle Earth EngineLeverhulme Centre for Nature Recovery
קרא עוד
שילוב בינה מלאכותית במסרים שיווקיים פוגע באמון הלקוחות
מחקר
לפני 4 שעות
4 דקות
·מ־TechCrunch

שילוב בינה מלאכותית במסרים שיווקיים פוגע באמון הלקוחות

סקר חדש של חברת WordPress VIP חושף כי 60% מהצרכנים בארה"ב מרגישים רתיעה ממותגים המשתמשים במילה "AI" במסרים השיווקיים שלהם. בעוד שחברות ממהרות לבצע אופטימיזציה למנועי חיפוש מבוססי בינה מלאכותית, פער האמון הולך וגדל: 86% מהצרכנים אינם נותנים אמון מלא בתשובות ה-AI ומעדיפים מקורות מידע מקוריים ואנושיים. המחקר מדגיש את החשיבות ההולכת וגוברת של שמירה על שקיפות וייחוס מקורות (Attribution) ברשת האינטרנט, המרגישה כיום 'פחות אנושית' עבור 74% מהגולשים. עבור עסקים ישראליים, הממצאים מהווים תמרור אזהרה מפני שיווק-יתר טכנולוגי ומדגישים את הצורך בשימור החיבור האנושי בקדמת הבמה, לצד שילוב אוטומציות חכמות מאחורי הקלעים.

WordPress VIPAutomatticBrian Alvey
קרא עוד
פענוח תצלומי לוויין באמצעות בינה מלאכותית: מהפכת עיבוד הנתונים בחלל
מחקר
אתמול
4 דקות
·מ־TechCrunch

פענוח תצלומי לוויין באמצעות בינה מלאכותית: מהפכת עיבוד הנתונים בחלל

פריצת דרך היסטורית נרשמה באפריל 2026, כאשר לוויין התצפית Yam-9 של חברת Loft Orbital הצליח לזהות ולפענח עצמים על פני כדור הארץ באופן עצמאי לחלוטין. באמצעות שימוש במעגל מחשוב קצה המבוסס על מעבד Nvidia Jetson Orin AGX ומעטפת התוכנה NAVI-Orbital שפותחה על ידי מעבדת JPL של נאס"א, הלוויין הריץ את מודל השפה-חזותי (VLM) מסוג Gemma 3 של Google DeepMind. פיתוח זה מאפשר ניתוח וסינון ראשוני של נתונים חזותיים מורכבים ישירות בחלל, ומקטין דרמטית את הצורך בהורדת נפחי מידע גולמי עצומים לקרקע. עבור עסקים ותעשיות בישראל כגון חקלאות מדויקת וביטחון מולדת, פריצת הדרך מסמנת מעבר לעיבוד נתונים מהיר, חסכוני ומבוזר המבוסס על בינה מלאכותית.

Loft OrbitalNASAJPL
קרא עוד
אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל
מחקר
לפני 6 ימים
5 דקות
·מ־Google Research

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

חוקרי Google Research הציגו בוועידת AISTATS 2026 מסגרת עבודה מהפכנית בשם Regularized f-Divergence Kernel Tests, המיועדת לבצע אימות מחיקת מידע ממודלי בינה מלאכותית. השיטה החדשה מתגברת על כשלי הבדיקות הדו-מדגמיות המסורתיות (כמו MMD), ומאפשרת למבקרים חיצוניים לזהות דליפות מידע מקומיות ברמת דיוק חסרת תקדים. באמצעות שימוש במדדי שונות מתקדמים כמו Hockey-stick divergence ורגולריזציה של ליבות, המערכת מזהה הפרות פרטיות תוך שימוש בכמה אלפי דגימות בלבד בהשוואה למיליוני דגימות שנדרשו בעבר בשיטות כמו DP-Auditorium. פיתוח זה מעניק לעסקים הפועלים תחת רגולציות פרטיות מחמירות כלי מתמטי מוכח להבטחת עמידה בדרישות החוק.

AISTATS 2026Mónica RiberoAntonin Schrab
קרא עוד