מחקר
6 דקות
מ־arXiv cs.AI
InfoPO לאימון סוכני שיחה: כך מודדים ערך של כל שאלה
**InfoPO הוא מנגנון אימון שמתגמל סוכן LLM על שאלות הבהרה שמשנות בפועל את ההחלטה הבאה שלו.** לפי תקציר המחקר ב-arXiv, השיטה מודדת information gain בכל תור שיחה ומשלבת אותו עם תוצאת המשימה, במקום להסתפק בתגמול כולל על כל המסלול. עבור עסקים בישראל, המשמעות ברורה: בערוצים כמו WhatsApp, לידים מגיעים לעיתים קרובות בלי 2-3 פרטים קריטיים. סוכן שיודע לשאול בדיוק את שאלת ההבהרה הנכונה יכול לשפר סיווג לידים, לעדכן Zoho CRM נכון יותר, ולהפעיל אוטומציות N8N רק כשיש מספיק מידע. זהו כיוון חשוב במיוחד למרפאות, ביטוח, נדל"ן ושירות מקצועי.
קרא עוד