WebOperator: חיפוש עץ חכם לסוכנים אוטונומיים ברשת
מחקר

WebOperator: חיפוש עץ חכם לסוכנים אוטונומיים ברשת

סוכני LLM נתקעים באינטרנט? שיטה חדשה עם חזרה בטוחה ומבט קדימה משיגה שיא של 54.6% הצלחה

3 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • WebOperator פותרת בעיות חזרה אחורה בסוכני LLM בסביבות אינטרנט חלקיות

  • חיפוש הטובה ביותר קודם עם דירוג תגמול ובטיחות

  • מייצרת פעולות מגוונות ומסננת לא תקפות מראש

  • שיא של 54.6% ב-WebArena עם GPT-4o

  • משמעות גדולה לאוטומציה עסקית בישראל

WebOperator: חיפוש עץ חכם לסוכנים אוטונומיים ברשת

  • WebOperator פותרת בעיות חזרה אחורה בסוכני LLM בסביבות אינטרנט חלקיות
  • חיפוש הטובה ביותר קודם עם דירוג תגמול ובטיחות
  • מייצרת פעולות מגוונות ומסננת לא תקפות מראש
  • שיא של 54.6% ב-WebArena עם GPT-4o
  • משמעות גדולה לאוטומציה עסקית בישראל
סוכני AI מבוססי מודלי שפה גדולים (LLM) פועלים לעיתים קרובות בצורה חמדנית, צעד אחר צעד, מבלי להתחשב בהשלכות ארוכות הטווח או בנתיבים חלופיים. בעולם האינטרנט, שהוא סביבה חלקית נצפית – מוגבלת לתוכן הנראה בדפדפן כמו DOM ויסודות ממשק משתמש – טעות אחת עלולה להוביל לניווט מורכב ומזיק לתיקון. ללא מנגנון חזרה אחורה מפורש, הסוכנים מתקשים לתקן שגיאות או לחקור נתיבים שונים. מאמר חדש ב-arXiv מציג את WebOperator, מסגרת חיפוש עץ שמאפשרת חזרה אמינה וחקר אסטרטגי. WebOperator משלב אסטרטגיית חיפוש הטובה ביותר קודם (best-first search), שמדרגת פעולות על פי הערכות תגמול ובטיחות, לצד מנגנון חזרה אחורה חזק שבודק את ההיתכנות של נתיבים קודמים לפני השמעתם מחדש, ומנע תופעות לוואי לא רצויות. השיטה מניחה שפעולות אינן תמיד הפיכות ומטפלת בכך. בנוסף, היא מייצרת מועמדי פעולות ממספר הקשרי חשיבה מגוונים להבטחת חקר רחב, ואז מסננת פעולות לא תקפות וממזגת שקולות סמנטיות דומות לפני ביצוע. בניסויים על WebArena ו-WebVoyager, WebOperator מציגה ביצועים מרשימים. ב-WebArena, היא משיגה שיעור הצלחה של 54.6% עם GPT-4o, שיא חדש שמדגיש את היתרון של שילוב תכנון אסטרטגי עם ביצוע בטוח. השיפור נובע מיכולתה להתמודד עם סביבות ריאליסטיות של אינטרנט, שבהן סוכנים רגילים נכשלים. המשמעות של WebOperator גדולה במיוחד לעסקים ישראליים בתחום האוטומציה. חברות כמו וויקס או פיוניר שמשתמשות בסוכנים אוטונומיים לניהול אתרים, שירות לקוחות או איסוף נתונים יכולות להפיק תועלת משמעותית. השיטה מאפשרת אוטומציה אמינה יותר של משימות מורכבות ברשת, מפחיתה טעויות ומגבירה יעילות. בהשוואה לשיטות קיימות, היא מציעה בטיחות גבוהה יותר ללא הנחות על היפוכיות פעולות. לסיכום, WebOperator מסמנת קפיצה קדימה בפיתוח סוכנים אוטונומיים לסביבות אינטרנט. מנהלי טכנולוגיה בישראל צריכים לשים עין על הפיתוח הזה, שמבטיח לשנות את אופן אוטומציית העבודה הדיגיטלית. האם סוכני ה-LLM שלכם מוכנים למשימות אמיתיות?

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

המידע שתמסור ישמש ליצירת קשר ומתן שירותים. למידע נוסף ראה מדיניות פרטיות ותנאי שימוש

עוד כתבות שיעניינו אותך

לכל הכתבות
השראת IIT למודעות ב-LLMs: מסגרת תגמול חדשה
מחקר
2 דקות

השראת IIT למודעות ב-LLMs: מסגרת תגמול חדשה

האם מודלי שפה גדולים יכולים לפתח 'מודעות' דמוית אנושית? חוקרים מציגים מסגרת למידה מבוססת תגמול בהשראת תיאוריית המידע המשולב (IIT)... קראו עכשיו את הפרטים המלאים! (112 מילים)

Integrated Information TheoryLLMsAGI
קרא עוד
AutoRefine: שיפור סוכני LLM מתמשך מניסיון
מחקר
3 דקות

AutoRefine: שיפור סוכני LLM מתמשך מניסיון

בעולם שבו סוכני דגמי שפה גדולים נתקלים במשימות חדשות ללא למידה מניסיון, AutoRefine משנה את חוקי המשחק עם חילוץ דפוסי ניסיון דואליים ותחזוקה רציפה. תוצאות: 98.4% ב-ALFWorld ועד 27.1% ב-TravelPlanner. קראו עכשיו!

AutoRefineALFWorldScienceWorld
קרא עוד