זיהוי חריגות בבית חכם עם LLM: למה הדיוק עדיין נמוך

10 במרץ 2026

5 דקות

מ־arXiv cs.AI

זיהוי חריגות בבית חכם עם LLM: למה הדיוק עדיין נמוך

**זיהוי חריגות בבית חכם באמצעות מודלי שפה גדולים עדיין אינו בשל לפריסה אוטונומית.** מחקר SmartBench, שבחן 13 מודלים, מצא שגם Claude-Sonnet-4.5 הגיע ל-66.1% דיוק בלבד בזיהוי חריגות ללא הקשר ול-57.8% בחריגות תלויות-הקשר. המשמעות חורגת הרבה מעבר לבית חכם: כל עסק שבונה תהליכים מבוססי AI לזיהוי מצבים חריגים — ב-CRM, ב-WhatsApp או באוטומציות — צריך לשלב כללים קשיחים, נתונים היסטוריים ובקרה אנושית. עבור עסקים בישראל, במיוחד במרפאות, נדל"ן, ביטוח ושירותים מקצועיים, המסקנה המעשית היא לא להפקיד החלטות תפעוליות בידי LLM בלבד, אלא לחבר בין AI Agents, WhatsApp Business API, Zoho CRM ו-N8N במסגרת מבוקרת ומדידה.

SmartBench Claude-Sonnet-4.5 McKinsey

קרא עוד