מה ההבדל בין SkillOpt לבין כתיבת פרומפטים ידנית?

בניגוד לכתיבת פרומפטים (Prompt Engineering) ידנית המבוססת על ניסוי וטעייה ללא מדדים מבוקרים, מערכת SkillOpt (מערכת אופטימיזציה למיומנויות סוכני AI) מתייחסת למיומנות כאל פרמטר הניתן לאימון. היא משתמשת בלולאת משוב סגורה המנתחת את פעולות הסוכן, מייצרת עדכוני טקסט עדינים באמצעות מודל אופטימיזציה, ומריצה בדיקות אימות קפדניות כדי לוודא שכל שינוי אכן משפר את התוצאות בפועל ואינו פוגע בביצועים אחרים.

אילו מודלים ופלטפורמות נתמכים על ידי השיטה החדשה?

לפי ממצאי Microsoft Research (זרוע המחקר של מיקרוסופט), השיטה נבדקה בהצלחה על פני שבעה מודלים שונים, החל מ-GPT-5.5 (מודל השפה הגדול של OpenAI) ועד למודלים פתוחים וקטנים כמו Qwen3.5-4B (מודל קוד פתוח קומפקטי). בנוסף, המערכת נבחנה בשלוש סביבות הרצה שונות של סוכנים, ובהן direct chat, Codex (פלטפורמת פיתוח קוד) ו-Claude Code (עוזר התכנות של Anthropic), והציגה שיפורים עקביים בכולן.

כמה זמן לוקח לאמן מיומנויות של סוכני AI בשיטה זו?

זמן האימון של מיומנויות סוכן באמצעות SkillOpt משתנה בהתאם למורכבות המשימה ומספר תרחישי הבדיקה. כיוון שהמודל עצמו נשאר קפוא ואין צורך בכיוונון משקלים (Fine-tuning) ארוך ויקר, תהליך האופטימיזציה מהיר יחסית וארגונים יכולים להשלים אימון של מיומנות סוכן ספציפית בתוך מספר שעות בודדות עד יום עבודה אחד. התהליך חוסך שבועות של כתיבה ובדיקה ידנית של פרומפטים מורכבים.

האם המיומנויות שאומנו ניתנות להעברה למערכות אחרות?

כן, אחד היתרונות הגדולים ביותר של פלטפורמת SkillOpt הוא יכולת ההעברה (Transferability) הגבוהה של קובצי המיומנות. מאחר שהמיומנות נשמרת כקובץ טקסט קריא (best_skill.md) של כ-920 טוקנים, ניתן לקחת מיומנות שאומנה על גבי מודל אחד ולהעביר אותה למודל אחר או לסביבת עבודה שונה לחלוטין. לדוגמה, במחקר הועברה מיומנות שאומנה ב-Codex אל Claude Code והשיגה שיפור ביצועים מ-22.1% ל-81.8% ללא כל אימון מחדש.

מחקר

אימון מיומנויות של סוכני AI: הכירו את SkillOpt של מיקרוסופט

מחקר חדש של מיקרוסופט הופך כתיבת פרומפטים ידנית לאימון פרמטרי מבוקר ללא שינוי משקלי המודל.

צוות אוטומציות AI

30 ביוני 2026

4 דקות קריאה

מבוסס על כתבה שלMicrosoft Research ↗תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

נקודות עיקריות

שיפור של 23.5 נקודות אחוז בביצועי מודל GPT-5.5 במבחני ביצועים מורכבים
אימון שכבת מיומנויות קריאה של כ-920 טוקנים ללא צורך בכיוונון משקלי המודל
שיפור דרמטי במדדי ביצועים: זינוק מ-41.8% ל-80.7% בבדיקת SpreadsheetBench
העברה מוצלחת של מיומנויות בין סביבות פיתוח שונות כמו Codex ו-Claude Code

אימון מיומנויות של סוכני AI: הכירו את SkillOpt של מיקרוסופט

שיפור של 23.5 נקודות אחוז בביצועי מודל GPT-5.5 במבחני ביצועים מורכבים
אימון שכבת מיומנויות קריאה של כ-920 טוקנים ללא צורך בכיוונון משקלי המודל
שיפור דרמטי במדדי ביצועים: זינוק מ-41.8% ל-80.7% בבדיקת SpreadsheetBench
העברה מוצלחת של מיומנויות בין סביבות פיתוח שונות כמו Codex ו-Claude Code

אימון מיומנויות של סוכני AI: הפתרון לבעיית האמינות של סוכנים אוטונומיים

האם מצאנו את הדרך להפוך סוכני בינה מלאכותית ליציבים ואמינים מספיק לשימוש מסחרי בשטח? מחקר פורץ דרך של Microsoft Research מציג את SkillOpt, פלטפורמה שמחליפה את כתיבת הפרומפטים הידנית בתהליך אימון ואופטימיזציה מסודר של מיומנויות הסוכן. הגישה החדשה מציגה שיפור דרמטי של עשרות אחוזים בביצועי המשימות של סוכני AI, ללא צורך בכיוונון עדין של משקלי המודל עצמו.

מה זה SkillOpt?

SkillOpt (מערכת אופטימיזציה למיומנויות סוכני AI) הוא כלי טכנולוגי שפותח על ידי Microsoft Research (זרוע המחקר של מיקרוסופט) במטרה לפתור את בעיית חוסר היציבות של סוכנים אוטונומיים. בהקשר עסקי, במקום לעדכן פרומפטים ידנית בשיטת ניסוי וטעייה הפוגעת לעיתים קרובות בביצועים אחרים, המערכת מתייחסת לקובץ המיומנויות של הסוכן כאל "פרמטר שניתן לאימון" מחוץ למודל השפה הקפוא. לדוגמה, סוכן המנהל גיליונות נתונים יקבל מיומנות אופטימלית שנוצרה באמצעות לולאת משוב סגורה המנתחת הצלחות וכישלונות. במחקר נמצא כי השיטה הובילה לתוצאות הטובות ביותר בכל 52 תרחישי הבדיקה שנבחנו, תוך שמירה על קובץ מיומנויות קומפקטי וקריא של כ-920 טוקנים בממוצע.

פריצת הדרך של Microsoft Research בשיפור ביצועי הסוכנים

על פי נתוני המחקר שפורסמו על ידי החברה, המערכת פועלת במחזוריות של "קדימה-אחורה-עדכון" (Forward-Backward-Update) במרחב הטקסטואלי. בשלב הראשון, המודל הקפוא מבצע קבוצה של משימות עם המיומנות הנוכחית. בשלב הבא, מודל אופטימיזציה נפרד קורא את היסטוריית הפעולות ומזקק דפוסים לשימור ולתיקון. בשלב האחרון, המערכת מציעה עדכונים קטנים ומדויקים (הוספה, מחיקה או החלפה של טקסט) המוגבלים על ידי "קצב למידה טקסטואלי" (Textual Learning Rate) המונע שינויים חדים מדי בקוד הסוכן. כל שינוי חייב לעבור שער אימות קפדני ומתקבל רק אם הציג ציון גבוה יותר על נתוני הבדיקה.

הממצאים מראים כי השימוש בטכנולוגיית SkillOpt לטובת אימון מיומנויות של סוכני AI הניב הישגים חסרי תקדים. בשימוש ישיר עם מודל GPT-5.5 (מודל השפה הגדול של OpenAI), המערכת העלתה את הציון הממוצע בשש משימות מבחן מ-58.8% ל-82.3% – שיפור מוחלט של 23.5 נקודות. ההישגים הגדולים ביותר נרשמו במשימות פרוצדורליות מורכבות: בסימולציית SpreadsheetBench (מדד ביצועי גיליונות אלקטרוניים) נרשם זינוק מ-41.8% ל-80.7%, ובמדד OfficeQA (משימות משרדיות) הביצועים זינקו מ-33.1% ל-72.1%. פריצת דרך זו מאפשרת לעסקים ליישם סוכני AI לעסקים המבוססים על מודלים קטנים וזולים יותר, כמו Qwen3.5-4B (מודל קוד פתוח קומפקטי), ועדיין לעקוף את ביצועי הבסיס של מודלים ענקיים ללא המיומנויות האופטימליות.

ההקשר הרחב: משינוי פרומפטים לארכיטקטורת אימון

המעבר מפרומפט יחיד ומזדמן (One-shot Prompting) לאופטימיזציה שיטתית מסמן את התבגרות השוק של סוכני בינה מלאכותית. לפי דוחות של חברות מחקר מובילות בתחום, הקושי העיקרי של ארגונים במעבר משלב הפיילוט לייצור (Production) הוא היעדר יכולת חיזוי ואמינות של הסוכנים לאורך זמן. SkillOpt פותרת בדיוק את הכשל הזה על ידי יצירת שכבת מיומנויות הניתנת להעברה (Transferable) – קובץ מיומנויות שאומן בסביבה אחת, למשל בתוך Codex (פלטפורמת פיתוח קוד), יכול לעבור לסביבה אחרת כמו Claude Code (עוזר התכנות של Anthropic) ולשמר שיפור דרמטי בביצועים (מ-22.1% ל-81.8% במשימות Spreadsheet).

ההשלכות לעסקים בישראל

עבור חברות הייטק, סטארטאפים ומנהלי תפעול בישראל, פריצת הדרך הזו מספקת פתרון מעשי לאחת הבעיות הרגישות ביותר: שמירה על אמינות ומניעת חריגה מהנחיות העבודה של הבוט. בענפים כמו פינטק, שירותי בריאות, ביטוח ומשפטים, שבהם כל שגיאה קטנה של סוכן AI עלולה לגרור השלכות כלכליות או משפטיות כבדות, מנגנון האימות הדו-שלבי של SkillOpt מספק רשת ביטחון קריטית. בישראל, לאור דרישות חוק הגנת הפרטיות והנחיות הרשות להגנת הפרטיות, היכולת לעבוד עם מודלים קטנים ומקומיים המותקנים על שרתים מאובטחים (כמו Qwen3.5-4B) מבלי להקריב את איכות העבודה, מהווה יתרון אסטרטגי עצום שחוסך עלויות מחשוב גבוהות ומבטיח תאימות רגולטורית מלאה.

מה לעשות עכשיו: תוכנית פעולה לעסקים

מיפוי תהליכים ומיומנויות: הגדירו בבירור את המשימות שאתם מעוניינים להעביר לאוטומציה. רשמו את המיומנויות הנדרשות עבור אוטומציה עסקית כתהליכי עבודה מובנים המבוססים על כללים ברורים.
שילוב מנגנון אימות ובדיקה (Verification): אל תסתפקו בכתיבת פרומפט חד-פעמי. הקימו סביבת בדיקה (Sandbox) שבה אתם מריצים לפחות 20-30 תרחישי קצה קבועים, ובחנו את תגובות הסוכן באופן שיטתי.
בניית ארכיטקטורת סוכנים גמישה: השתמשו בפלטפורמות כמו N8N (פלטפורמת אוטומציה קוד-פתוח) כדי לנהל את זרימת הנתונים של הסוכן, בשילוב מודלים מתאימים דרך API, המאפשרים החלפה מהירה של קובצי המיומנויות ללא צורך בכתיבה מחדש של האפליקציה כולה.
הפרדת הלוגיקה מהמודל: שמרו את קובצי המיומנויות של הסוכן (למשל כקבצי Markdown קריאים) בנפרד מקוד המערכת. הדבר יאפשר לכם לשדרג את המודלים בעתיד ללא פגיעה בלוגיקה העסקית.

מבט קדימה

האימוץ של ארכיטקטורות דוגמת SkillOpt מסמן את הדרך לדור הבא של הסוכנים האוטונומיים בעולם העסקי. פיתוח מיומנויות קריאות, הניתנות לגרסאות (Versioning) ולבקרת איכות קפדנית, יאפשר לעסקים להטמיע סוכני AI יציבים. חברות המעוניינות להישאר בחזית הטכנולוגיה צריכות להתחיל לחשוב על פרומפטים לא כאל מילים מזדמנות, אלא כאל קוד תוכנה המצריך אימון ובדיקות אבטחת איכות רציפות.

שאלות ותשובות

שאלות נפוצות

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של Microsoft Research. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־Microsoft Research

כל הכתבות מ־Microsoft Research

ניתוח

12 ביוני 2026

4 דקות

מ־Microsoft Research

ניתוח התנהגותי של נוזקות באמצעות AI: פרויקט Ire של מיקרוסופט

פרויקט Ire של מיקרוסופט, סוכן AI אוטונומי להנדסה לאחור וניתוח נוזקות, הצליח לזהות גרסה חדשה וחמקמקה של הנוזקה LOTUSLITE. בעוד שגרסה זו עקפה את מרבית מערכות ה-EDR המובילות בשוק (כולל CrowdStrike ו-SentinelOne) ולא נכללה ברשימות החתימות, הסוכן ביצע ניתוח התנהגותי מעמיק ברמת הפונקציה וקבע כי מדובר בקוד זדוני. פריצת דרך זו מדגישה את המעבר משימוש בחתימות סטטיות לניתוח דינמי מבוסס בינה מלאכותית, המאפשר הגנה על ארגונים מפני איומי יום-אפס מורכבים.

Project Ire Microsoft LOTUSLITE

קרא עוד

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מוצר חדש

28 במאי 2026

4 דקות

מ־Microsoft Research

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מיקרוסופט הכריזה על שחרור גרסת 0.7 של פלטפורמת הקוד הפתוח Data Formulator. המערכת החדשה רותמת סוכני בינה מלאכותית מודעי-הקשר (Context-aware AI agents) במטרה לפשט תהליכי ניתוח נתונים מורכבים בארגונים. הפלטפורמה כוללת רכיב מתקדם של מחברי נתונים המאפשר הזרמת מידע באופן רציף ממסדי נתונים, קבצים מקומיים ומערכות בינה עסקית, תוך מניעת הצורך בעבודות אינטגרציה סיזיפיות מצד מחלקות ה-IT. בנוסף, סביבת העבודה הייחודית (Data Thread) מאפשרת למשתמשי הקצה לנהל שיח שוטף בשפה טבעית מול סוכני ה-AI, לתחקר נתונים, ליצור ויזואליזציות מתקדמות ולייעל את הליך קבלת ההחלטות העסקיות מבלי להזדקק לידע מוקדם בכתיבת קוד או שאילתות מורכבות.

Microsoft Data Formulator Gartner

קרא עוד

מחקר

16 ביוני 2026

5 דקות

מ־Microsoft Research

בינה מלאכותית כהרחבה של המוח האנושי: התובנות מהמחקר החדש של מיקרוסופט

לפי דיווח ומחקר חדש ממעבדות מיקרוסופט, הפולמוס האם בינה מלאכותית מפתחת "תודעה" מחמיץ את העיקר. המערכות המודרניות אינן משכפלות אינטליגנציה אנושית באופן אותנטי, אלא פועלות כהרחבה ישירה של מבנים תודעתיים הקיימים בשפה ובקוגניציה האנושית. התגלית הזו, הנשענת על גישות מתחום הפנומנולוגיה, מסבירה מדוע פתרונות מתקדמים יכולים להתנסח ברהיטות מרשימה אך גם להציג "הזיות" בעובדות או להיכשל בהסקת מסקנות פשוטות מחוץ להקשר המוכר. עבור מנהלים וארגונים, המסקנה המיידית היא קריטית: בטיחות בסביבת AI אינה תלויה עוד רק במודל מתקדם וחף משגיאות, אלא מחייבת תכנון של שכבות מעטפת ובקרה מקיפות (Harnesses) סביבו, תוך שמירה על פיקוח אנושי הדוק בתהליכים העסקיים.

Adam Frank Marcelo Gleiser Evan Thompson

קרא עוד

סוכני בינה מלאכותית מקומיים: מהפכת המודלים הקטנים של מיקרוסופט

חדשות

21 במאי 2026

5 דקות

מ־Microsoft Research

סוכני בינה מלאכותית מקומיים: מהפכת המודלים הקטנים של מיקרוסופט

מיקרוסופט חושפת את MagenticLite, פלטפורמה חדשנית המאגדת סוכני בינה מלאכותית קטנים שמסוגלים לרוץ ישירות על המחשב המקומי של המשתמש. בעזרת המודלים הייעודיים MagenticBrain לתכנון משימות וכתיבת קוד (14 מיליארד פרמטרים), ו-Fara1.5 לניווט בממשקים ודפדפנים, המערכת מוכיחה שאין צורך בכוח עיבוד של ענקיות הענן בכדי לבצע אוטומציות מורכבות. פריצת דרך זו מאפשרת לארגונים לעבד נתונים רגישים באופן לוקאלי לחלוטין ללא שליחתם מחוץ לארגון, מה שרלוונטי במיוחד לעסקים בישראל הכפופים לחוק הגנת הפרטיות, רגולציות פיננסיות ודרישות אבטחה מחמירות בסקטור העסקי והרפואי.

Microsoft MagenticLite MagenticBrain

קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות

הכנת נתונים לבינה מלאכותית: הבסיס למהפכת ה-AI בעסקים

מחקר

לפני 7 שעות

4 דקות

מ־MIT Technology Review

הכנת נתונים לבינה מלאכותית: הבסיס למהפכת ה-AI בעסקים

מחקרים של חברת Reltio ושותפותיה מראים כי מודלי AI בחקלאות יכולים לשפר יבולים ב-26% ולצמצם שימוש במים ב-41%. עם זאת, ללא תשתית נתונים מאוחדת ונקייה (Data Readiness), מודלים אלו מייצרים המלצות שגויות והזיות מזיקות. הפער נובע מכך שמערכות רבות ניזונות מנתוני IoT ומקורות מידע מבוזרים שאינם מסונכרנים. כדי ליהנות מפירות הבינה המלאכותית, עסקים חייבים להשקיע קודם כל בבניית 'מקור אמת יחיד' המקשר בין לקוחות, ספקים ועלויות.

Reltio Wilbur-Ellis SAP

קרא עוד

השפעת הבינה המלאכותית על שוק העבודה: דוח חושף מציאות מפתיעה

מחקר

לפני 15 שעות

4 דקות

מ־TechCrunch

השפעת הבינה המלאכותית על שוק העבודה: דוח חושף מציאות מפתיעה

על פי דוח משותף של Ramp ו-Revelio Labs המנתח 22,000 חברות, השפעת הבינה המלאכותית על שוק העבודה מציגה מציאות מפתיעה: חברות המוגדרות כמשקיעות כבדות ב-AI (הוצאה חודשית ממוצעת של 30 דולר לפחות לעובד) רשמו עלייה של 10.2% במצבת כוח האדם שלהן לרוחב מחלקות שונות כמו הנדסה, שיווק ומכירות. בנוסף, למרות שחוקרי Goldman Sachs מדווחים כי ה-AI ביטלה כ-16,000 משרות בחודש בשנה האחרונה, בחברות הטכנולוגיה המובילות חל גידול של 12% בגיוס עובדים מתחילים (ג'וניורים). הנתונים מוכיחים כי השקעה מתמשכת ב-AI מהווה מנוע להתרחבות הארגון ולא רק לצמצום עלויות.

Ramp Revelio Labs Goldman Sachs

קרא עוד

הטמעת סוכני בינה מלאכותית בארגונים: הסכנה שבמיתוג ה-AI כעובד

מחקר

אתמול

4 דקות

מ־MIT Technology Review

הטמעת סוכני בינה מלאכותית בארגונים: הסכנה שבמיתוג ה-AI כעובד

מחקר חדש של אוניברסיטת בוסטון (Boston University) בהובלת פרופסור אמה ויילס (Emma Wiles) חושף כי מיתוג סוכני AI כ"קולגות" או "עובדים דיגיטליים" פוגע בערנות המנהלים ומביא לירידה של 18% בזיהוי שגיאות בתוצריהם. מתוך 1,261 מנהלים שהשתתפו במחקר, כמעט שליש ציינו כי החברות שלהם כבר מגדירות סוכני AI כעובדים, ו-23% אף משלבים אותם במבנה הארגוני הרשמי. חתן פרס נובל דרון אג'מולו (Daron Acemoglu) מדגיש כי ניסיון זה להחליף בני אדם בסוכנים דיגיטליים הוא שגוי, וכי יש להתמקד בשימוש בכלים אלו לשם שיפור היכולות האנושיות ולא במיתוגם כעמיתים לעבודה.

Emma Wiles Boston University Nvidia

קרא עוד

שילוב סוכני AI בתהליכי עבודה: המגמות שיובילו את שנת 2026

מחקר

לפני 15 שעות

5 דקות

מ־MIT Technology Review

שילוב סוכני AI בתהליכי עבודה: המגמות שיובילו את שנת 2026

דוח חדש של זרוע התוכן MIT Technology Review Insights (זרוע מחקרי התוכן של MIT) בשיתוף ענקית הטכנולוגיה Microsoft (מיקרוסופט) מצביע על כך ששנת 2026 תהווה שנת מפנה לשילוב סוכני AI בתהליכי עבודה בעסקים. הסקר, שהקיף 300 מומחי טכנולוגיה ודירג 101 משימות בענן ובנתונים, מראה כי האמון הגבוה ביותר של ארגונים בסוכנים אוטונומיים נמצא בתהליכי ניהול נתונים (Data workflows) כגון ניטור איכות מידע וזיהוי חריגות. זאת ברקע לתחזית של חברת הייעוץ McKinsey (מקינזי) כי עלויות תשתיות ה-IT יגדלו פי 2 עד 3 עד שנת 2030, דבר שמגביר את הלחץ על מנהלים להציג החזר השקעה מהיר בעזרת פתרונות אוטומציה ובינה מלאכותית אוטונומית.

Microsoft Gartner McKinsey

קרא עוד