הבנת אודיו במודלי שפה קוליים: למה DEAF חושף פער קריטי

20 במרץ 2026

5 דקות

מ־arXiv cs.AI

הבנת אודיו במודלי שפה קוליים: למה DEAF חושף פער קריטי

**הבנת אודיו אמינה במודלי שפה קוליים היא היכולת להישען על האות הקולי עצמו, לא רק על טקסט.** זה בדיוק מה שמחקר DEAF החדש בדק ביותר מ-2,700 תרחישים וב-7 מודלי Audio MLLM, ומצא דפוס עקבי: הטקסט עדיין שולט בהחלטות המודל. מבחינת עסקים בישראל, המשמעות ברורה: תמלול טוב לא מספיק אם המערכת מפספסת טון דיבור, רעשי רקע או זהות דובר. מי שמטמיע סוכני קול, מוקדי שירות אוטומטיים או סיכומי שיחה ל-CRM צריך להפריד בין שכבת תמלול, שכבת ניתוח אקוסטי ושכבת האוטומציה, ולבדוק את המודל על שיחות אמיתיות בעברית לפני חיבור ל-Zoho CRM, WhatsApp או N8N.

DEAF Audio MLLM McKinsey

קרא עוד