דלג לתוכן הראשי
אוטומציות AI - לוגו
  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
03-7630715קבע יעוץ חינם
אוטומציות AI - פתרונות אוטומציה וסוכני AI לעסקים בישראל

מובילים בתחום האוטומציה וסוכני AI בישראל. אנו מספקים פתרונות מתקדמים ליעול תהליכי עסק ושיפור הפרודוקטיביות הארגונית.

IL03-7630715USA(646) 760-4854info@automaziot.ai
אחד העם 9, תל אביב. מגדל שלום

קישורים מהירים

  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
  • סיפורי הצלחה
  • מילון מונחים

הפתרונות שלנו

  • ניהול לידים אוטומטי
  • סוכן חכם לוואטסאפ
  • אוטומציה עסקית מלאה
  • ניהול לקוחות חכם
  • קביעת תורים אוטומטית
  • מכירות ושירות לקוחות
  • חנות אוטומטית בוואטסאפ
  • סוכני AI
  • ייעוץ טכנולוגי

הישאר מעודכן

הירשם לניוזלטר שלנו וקבל עדכונים על חידושים בתחום האוטומציה וה-AI

FacebookInstagramLinkedIn

אתר זה משתמש ב-Google Analytics ו-Vercel Analytics לשיפור השירות. למידע מלא ראה מדיניות פרטיות

© 2026 אוטומציות AI. כל הזכויות שמורות.

מדיניות פרטיותתנאי שימושהצהרת נגישותמדיניות עריכה
מסגרת גוגל חדשה לניהול תקציב בכלי AI
גוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות
ביתחדשותגוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות
מחקר

גוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות

חוקרים מגוגל ו-U.C. סנטה ברברה פיתחו Budget Tracker ו-BATS – טכניקות שמאפשרות לסוכנים לחסוך עד 40% בשימוש בכלים ולשפר ביצועים

אייל יעקבי מילראייל יעקבי מילר
13 בדצמבר 2025
4 דקות קריאה

תגיות

GoogleUC Santa BarbaraGemini 2.5 ProReActBrowseCompZifeng WangTengxiao Liu

נושאים קשורים

#סוכני AI#למידת מכונה#אופטימיזציה#סקיילינג AI#כלי חיפוש

✨תקציר מנהלים

נקודות עיקריות

  • Budget Tracker מפחית 40% קריאות חיפוש ו-31% עלויות כוללות

  • BATS משיגה 24.6% דיוק ב-BrowseComp לעומת 12.6% ב-ReAct

  • הטכניקות מאפשרות אפליקציות ארגוניות ארוכות טווח כמו ביקורות ציות

  • סקיילינג מודע תקציב הופך סוכני AI לכדאיים כלכלית

גוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות

  • Budget Tracker מפחית 40% קריאות חיפוש ו-31% עלויות כוללות
  • BATS משיגה 24.6% דיוק ב-BrowseComp לעומת 12.6% ב-ReAct
  • הטכניקות מאפשרות אפליקציות ארגוניות ארוכות טווח כמו ביקורות ציות
  • סקיילינג מודע תקציב הופך סוכני AI לכדאיים כלכלית

בעידן שבו כל קריאת כלי AI עולה כסף וזמן, חוקרים מגוגל ומאוניברסיטת קליפורניה בסנטה ברברה מציגים מסגרת חדשה שמאפשרת לסוכני מודלי שפה גדולים (LLM) לנהל את תקציבי המחשוב והכלים שלהם ביעילות. המחקר, שפורסם לאחרונה, מציג שתי טכניקות מרכזיות: Budget Tracker הפשוט ו-BATS המקיף – Budget Aware Test-time Scaling. הטכניקות הללו הופכות את הסוכנים למודעים לתקציב הנותר שלהם, ומבטיחות שימוש חכם יותר במשאבים. עבור מנהלי ארגונים ישראלים, זהו צעד קריטי להטמעת סוכני AI ללא עלויות בלתי צפויות.

האתגר המרכזי בשימוש בכלים בסוכני AI הוא ניהול התקציב. סקיילינג בזמן מבחן מסורתי מתמקד בהארכת חשיבה, אך במשימות כמו גלישה באינטרנט, מספר קריאות הכלים קובע את עומק החקירה. 'קריאות כלים כמו תוצאות גלישה מגדילות צריכת טוקנים, מאריכות את ההקשר ומעלות השהיות ולעלויות API נוספות', אמרו זייפנג וואנג וטנגשיאו לו, שותפים למחקר, ל-VentureBeat. ללא מודעות תקציב, סוכנים מבזבזים משאבים על נתיבים ללא מוצא, כמו חקירת רמז לא רלוונטי במשך 10-20 קריאות.

כדי לפתור זאת, החוקרים פיתחו את Budget Tracker – מודול קל משקל הפועל ברמת הפרומפט. הוא מספק לסוכן אות תמידי על זמינות המשאבים, ומאפשר לו להתאים אסטרטגיה ללא אימון נוסף. ביישום של גוגל, המעקב מספק הנחיות מדיניות לתקציבים שונים ומעדכן צריכה בכל שלב. נבדקו פרדיגמות סקיילינג רציף ומקבילי על סוכני חיפוש עם כלי חיפוש וגלישה בסגנון ReAct. התוצאות: Budget Tracker משפר ביצועים בכל תקציב, עם 40.4% פחות קריאות חיפוש, 19.9% פחות גלישה וחיסכון כולל של 31.3% בעלויות, בהשוואה ל-ReAct רגיל.

מעבר לכך, BATS – Budget Aware Test-time Scaling – מסגרת מקיפה שמקסימיזית ביצועים בכל תקציב נתון. היא כוללת מודול תכנון שמתאים מאמץ צעד אחר צעד, ומודול אימות שמחליט אם להעמיק או לעבור נתיבים חלופיים. בתהליך, BATS בונה תוכנית פעולה, מוסיף תוצאות כלים להקשר, מאמת תשובות ומסיים ב-LLM ששופט את הטובה ביותר. נבדק על BrowseComp, BrowseComp-ZH ו-HLE-Search עם Gemini 2.5 Pro ו-Claude Sonnet 4. BATS השיגה 24.6% דיוק ב-BrowseComp לעומת 12.6% ב-ReAct, ו-27% ב-HLE-Search לעומת 20.5%.

הטכניקות הללו משנות את כללי המשחק בהשוואה למתחרים. בעוד ReAct מגיע לפלטו, Budget Tracker ו-BATS ממשיכים לשפר עם תקציב גדול יותר. בהשוואת עלויות, BATS משיגה דיוק גבוה בעלות של כ-23 סנט, לעומת 50 סנט בשיטות מקביליות. זה רלוונטי במיוחד לישראל, שבה חברות כמו וויקס ומובילאיי משלבות סוכני AI בפיתוח, ומחפשות אופטימיזציה לעלויות ענן גבוהות.

למנהלי עסקים, המסגרת פותחת אפליקציות ארוכות טווח כמו תחזוקת קוד מורכבת, בדיקות נאותות, מחקר תחרותי וביקורות ציות. 'זה הופך זרימות עבודה יקרות לכדאיות', אומרים החוקרים. הסוכנים לומדים לאזן דיוק ועלות, מה שיהפוך לדרישה עיצובית קריטית.

בעתיד, קשר בין חשיבה לכלכלה יהיה בלתי נפרד. 'מודלים חייבים לחשוב על ערך', אומרים וואנג וליו. מנהלים ישראלים צריכים לשקול אינטגרציה של BATS בפיתוחים הבאים.

מה תקציב הכלים שלכם לסוכני AI? האם הגיע הזמן לאמץ ניהול תקציב חכם?

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

המידע שתמסור ישמש ליצירת קשר ומתן שירותים. למידע נוסף ראה מדיניות פרטיות ותנאי שימוש

עוד כתבות שיעניינו אותך

לכל הכתבות
יישור נטיות התנהגות ב-LLM: למה מודלים עדיין בטוחים מדי
מחקר
3 באפר׳ 2026
6 דקות

יישור נטיות התנהגות ב-LLM: למה מודלים עדיין בטוחים מדי

**יישור נטיות התנהגות ב-LLM הוא בדיקה של עד כמה מודל שפה שופט מצבים חברתיים כמו בני אדם.** במחקר של Google על 25 מודלים נמצא שגם מודלים חזקים נשארים בטוחים מדי כשהקונצנזוס האנושי נמוך, ולעיתים בוחרים פתיחות, הרמוניה או פעולה מהירה בניגוד להעדפות משתתפים אנושיים. מבחינת עסקים בישראל, זו סוגיה תפעולית: אם מודל מחובר ל-WhatsApp, ל-CRM או לאוטומציה ב-N8N, הנטייה ההתנהגותית שלו משפיעה על שירות, מכירות ותיעוד. המסקנה הפרקטית היא לאמץ פיילוט מבוקר, להגדיר כללי הסלמה לאדם, ולמדוד לא רק דיוק תשובה אלא גם התאמה התנהגותית להקשר העסקי.

Google ResearchGoogleAmir Taubenfeld
קרא עוד
CDH-Bench חושף: מתי מודלי ראייה-שפה מתעלמים ממה שהם רואים
מחקר
2 באפר׳ 2026
5 דקות

CDH-Bench חושף: מתי מודלי ראייה-שפה מתעלמים ממה שהם רואים

**CDH-Bench הוא בנצ'מרק חדש שבודק מתי מודלי ראייה-שפה נשענים על היגיון מוקדם במקום על מה שמופיע בתמונה.** לפי המחקר, גם מודלי VLM חזקים נשארים פגיעים כאשר יש סתירה בין ראיה חזותית לבין commonsense. עבור עסקים בישראל, המשמעות מעשית: בתהליכים כמו בדיקת מסמכים, תמונות נזק, קטלוג מוצרים ושירות ב-WhatsApp, אסור להסתמך על המודל לבדו במקרי קצה. הדרך הנכונה היא לשלב בקרות דרך N8N, חוקים עסקיים ב-Zoho CRM ואימות אנושי בעת חריגה. כך הופכים מחקר אקדמי לתכנון נכון של אוטומציה עסקית מבוססת ראייה.

arXivCDH-BenchVision-Language Models
קרא עוד
איך רגשות משנים התנהגות של סוכני שפה: מה מחקר E-STEER מלמד
מחקר
2 באפר׳ 2026
6 דקות

איך רגשות משנים התנהגות של סוכני שפה: מה מחקר E-STEER מלמד

**רגש במודלי שפה יכול להפוך ממשתנה סגנוני למנגנון שליטה בביצועי סוכן.** זה המסר המרכזי ממחקר E-STEER שפורסם ב-arXiv באפריל 2026, ומציע התערבות ברמת הייצוג הפנימי של LLMs במקום הסתמכות על פרומפטים בלבד. לפי התקציר, רגשות מסוימים שיפרו לא רק reasoning ויצירה אלא גם בטיחות והתנהגות סוכנים מרובת שלבים. עבור עסקים בישראל, המשמעות היא שסוכן המחובר ל-WhatsApp Business API, Zoho CRM ו-N8N עשוי בעתיד לפעול במצבי החלטה שונים — שמרני, אמפתי או אסרטיבי — לפי סוג הפנייה. מי שבונה תהליכי שירות, מכירות ותיאום צריך להתחיל למדוד לא רק תשובה נכונה, אלא גם דפוס פעולה עקבי ובטוח.

arXivE-STEERLLMs
קרא עוד
פגיעות פרטיות ב-VLM מקומי: למה גם עיבוד על המכשיר לא מספיק
מחקר
30 במרץ 2026
6 דקות

פגיעות פרטיות ב-VLM מקומי: למה גם עיבוד על המכשיר לא מספיק

**מודל Vision-Language מקומי אינו מבטיח פרטיות מלאה.** מחקר חדש על LLaVA-NeXT ו-Qwen2-VL מראה כי גם בלי גישה לקבצים עצמם, אפשר להסיק מתזמון עיבוד ומעומס מטמון אם המערכת טיפלה במסמך, צילום רפואי או תוכן חזותי צפוף אחר. עבור עסקים בישראל, המשמעות ברורה: הרצה על המכשיר מפחיתה סיכוני ענן, אבל מחייבת בדיקת ערוצי צד, הרשאות תחנה, לוגים וחיבורי API. ארגונים שמחברים VLM מקומי ל-Zoho CRM, ל-WhatsApp Business API או לזרימות N8N צריכים לבחון לא רק איפה הנתון נשמר, אלא גם אילו אותות טכניים נפלטים בזמן העיבוד.

arXivLLaVA-NeXTQwen2-VL
קרא עוד