דלג לתוכן הראשי
אוטומציות AI - לוגו
  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
03-7630715קבעו ייעוץ חינם
אוטומציות AI - פתרונות אוטומציה וסוכני AI לעסקים בישראל

בונים סוכני AI ואוטומציות לעסקים בישראל: וואטסאפ, CRM, לידים, תורים, חשבוניות, דשבורדים וחיבור מערכות.

IL03-7630715USA(646) 760-4854info@automaziot.ai
אחד העם 9, תל אביב. מגדל שלום

קישורים מהירים

  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
  • סיפורי הצלחה
  • מילון מונחים

הפתרונות שלנו

  • ניהול לידים אוטומטי
  • סוכן חכם לוואטסאפ
  • חיבור מערכות ודשבורדים
  • ניהול לקוחות חכם
  • קביעת תורים אוטומטית
  • מכירות ושירות לקוחות
  • אוטומציה לאיקומרס
  • סוכני AI
  • ייעוץ אוטומציה

הישארו מעודכנים

הירשמו לניוזלטר וקבלו עדכונים על חידושים בעולם האוטומציה וה-AI

FacebookInstagramLinkedIn

אתר זה משתמש ב-Google Analytics ו-Vercel Analytics לשיפור השירות. למידע מלא ראה מדיניות פרטיות

© 2026 אוטומציות AI. כל הזכויות שמורות.

מדיניות פרטיותתנאי שימושהצהרת נגישותמדיניות עריכה
TurboQuant לדחיסת KV Cache: מה זה אומר | Automaziot
TurboQuant לדחיסת KV Cache: מהפכת ביצועים למודלי AI
ביתחדשותTurboQuant לדחיסת KV Cache: מהפכת ביצועים למודלי AI
ניתוח

TurboQuant לדחיסת KV Cache: מהפכת ביצועים למודלי AI

גוגל טוענת לדחיסה של פי 6 ולמהירות עד פי 8 — ומה זה אומר לעסקים ישראליים עם חיפוש ו-AI

צוות אוטומציות AIצוות אוטומציות AI
24 במרץ 2026
6 דקות קריאה

תגיות

Google ResearchTurboQuantQuantized Johnson-LindenstraussQJLPolarQuantICLR 2026AISTATS 2026GemmaMistralLongBenchNeedle In A HaystackZeroSCROLLSRULERL-EvalLlama-3.1-8B-InstructH100JAXPQRabbiQGloVeGartnerWhatsApp Business APIZoho CRMN8N

נושאים קשורים

#דחיסת מודלי שפה#חיפוש וקטורי#RAG לעסקים#WhatsApp Business API ישראל#Zoho CRM אינטגרציות#N8N אוטומציה
מבוסס על כתבה שלGoogle Research ↗·תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

נקודות עיקריות

  • לפי Google Research, TurboQuant מקטין את זיכרון ה-KV cache לפחות פי 6 בלי פגיעה בדיוק במשימות long-context.

  • ב-4 ביטים, TurboQuant השיג לפי הדיווח עד פי 8 שיפור בביצועי attention logits על מאיצי H100 לעומת 32 ביט.

  • החידוש נשען על PolarQuant ו-QJL, כולל שימוש ב-1 ביט לטיפול בשגיאה שיורית וביטול תקורת זיכרון מיותרת.

  • לעסקים בישראל עם Zoho CRM, WhatsApp Business API ו-N8N, המשמעות היא פוטנציאל לקיצור זמני תגובה והוזלת תשתית.

  • פיילוט עסקי ראשוני לחיפוש סמנטי או מענה מבוסס מסמכים יכול להתחיל בטווח של ₪2,000-₪8,000 לפני הרחבה.

TurboQuant לדחיסת KV Cache: מהפכת ביצועים למודלי AI

  • לפי Google Research, TurboQuant מקטין את זיכרון ה-KV cache לפחות פי 6 בלי פגיעה בדיוק...
  • ב-4 ביטים, TurboQuant השיג לפי הדיווח עד פי 8 שיפור בביצועי attention logits על מאיצי...
  • החידוש נשען על PolarQuant ו-QJL, כולל שימוש ב-1 ביט לטיפול בשגיאה שיורית וביטול תקורת זיכרון...
  • לעסקים בישראל עם Zoho CRM, WhatsApp Business API ו-N8N, המשמעות היא פוטנציאל לקיצור זמני תגובה...
  • פיילוט עסקי ראשוני לחיפוש סמנטי או מענה מבוסס מסמכים יכול להתחיל בטווח של ₪2,000-₪8,000 לפני...

TurboQuant לדחיסת KV Cache ולחיפוש וקטורי מהיר

TurboQuant הוא אלגוריתם דחיסה חדש של Google Research שמכווץ וקטורים ו-KV cache במודלי שפה בלי פגיעה בדיוק, ולפי הדיווח משיג הקטנת זיכרון של לפחות פי 6 ומהירות חישוב של עד פי 8 על H100. עבור עסקים בישראל, זו לא רק בשורת תשתית למהנדסים. זו התפתחות שיכולה להוריד עלויות הרצה של עוזרי AI, לשפר זמני תגובה במנועי חיפוש סמנטיים, ולאפשר ליישומים מבוססי מסמכים, צ'אט ושירות לקוחות לעבוד על חומרה מצומצמת יותר. בשוק שבו כל שניית תגובה משפיעה על המרה, המספרים האלה חשובים.

מה זה דחיסת KV Cache?

דחיסת KV Cache היא שיטה להקטין את הזיכרון שמודל שפה צורך בזמן עיבוד טקסט ארוך. ה-KV cache שומר ייצוגים פנימיים של הטוקנים הקודמים, כדי שהמודל לא יחשב הכול מחדש בכל שלב. בהקשר עסקי, המשמעות היא שאפשר להפעיל צ'אטבוט, סיכום מסמכים או ניתוח שיחות על הקשרים ארוכים יותר ובעלות נמוכה יותר. לפי הדיווח של Google Research, צוואר הבקבוק הזה משמעותי במיוחד במודלים גדולים ובמשימות long-context, ולכן כל חיסכון של ביטים בודדים לכל ערך מצטבר להבדל גדול בזיכרון ובמהירות.

מה גוגל הציגה ב-TurboQuant

לפי הדיווח, Google Research הציגה את TurboQuant יחד עם שני רכיבים אלגוריתמיים: Quantized Johnson-Lindenstrauss, או QJL, ו-PolarQuant. המטרה היא לפתור בעיה מוכרת בדחיסת וקטורים: לא רק איך לייצג כל מספר בפחות ביטים, אלא איך לבטל את תקורת הזיכרון שנוצרת כשצריך לשמור קבועי קוונטיזציה לכל בלוק נתונים. גישות מסורתיות, לפי גוגל, מוסיפות לעיתים 1 עד 2 ביטים לכל מספר — תוספת שמוחקת חלק מהחיסכון. TurboQuant נועד לצמצם בדיוק את התקורה הזאת.

לפי החברה, השיטה פועלת בשני שלבים. תחילה PolarQuant מבצע רוטציה אקראית של הווקטורים וממיר אותם לייצוג פולרי, כך שאפשר לדחוס את הנתונים בצורה יעילה יותר בלי נרמול יקר. אחר כך QJL משתמש בייצוג של 1 ביט בלבד לסימן, כדי לטפל בשגיאה השיורית שנותרה אחרי הדחיסה הראשית ולבטל הטיה בחישוב attention score. גוגל מדווחת שהשילוב הזה מאפשר לדחוס את ה-KV cache ל-3 ביטים בלי אימון נוסף ובלי fine-tuning, תוך שמירה על הדיוק של המודל.

התוצאות שגוגל מדווחת עליהן

הניסויים בוצעו, לפי הדיווח, על LongBench, Needle In A Haystack, ZeroSCROLLS, RULER ו-L-Eval, באמצעות מודלים פתוחים כמו Gemma ו-Mistral. ב-needle-in-a-haystack גוגל טוענת ש-TurboQuant שמר על תוצאות מושלמות לאורך כל הבנצ'מרקים ובמקביל הקטין את זיכרון ה-KV לפחות פי 6. בנוסף, ב-4 ביטים TurboQuant השיג עד פי 8 שיפור בביצועי attention logits לעומת מפתחות לא דחוסים ב-32 ביט על מאיצי H100. בחיפוש וקטורי, גוגל מדווחת על recall עדיף לעומת שיטות כמו PQ ו-RabbiQ גם בלי codebooks גדולים ובלי התאמה ייעודית לכל דאטה-סט.

ההקשר הרחב: למה דחיסת וקטורים הפכה קריטית

החדשות האלה מגיעות בזמן שבו כמעט כל מערכת AI עסקית נשענת על שני מנגנונים כבדים: מודל שפה וחיפוש וקטורי. לפי Gartner, עד 2027 יותר ממחצית ממערכות ה-Generative AI הארגוניות ישולבו עם אחזור מידע חיצוני או ארכיטקטורת RAG. כלומר, לא מספיק מודל טוב; צריך גם יכולת לאחסן, לאנדקס ולשלוף כמויות גדולות של embeddings במהירות. כאן דחיסת וקטורים הופכת מנושא אקדמי לנושא תקציבי. אם אפשר לשמור על דיוק דומה עם 3 או 4 ביטים במקום 16 או 32, ההשפעה נוגעת ישירות לעלות GPU, לזמן תגובה ולגודל האינדקס שניתן להחזיק בזיכרון.

ניתוח מקצועי: המשמעות האמיתית של TurboQuant

מניסיון בהטמעה אצל עסקים ישראליים, המשמעות האמיתית כאן היא לא רק ש"מודלים רצים מהר יותר", אלא שהכלכלה של פרויקטי AI משתנה. היום, הרבה פרויקטים נתקעים לא בגלל רעיון לא טוב אלא בגלל יחס לא סביר בין ערך עסקי לעלות תשתית. כשמערכת צריכה לעבד מסמכי ביטוח, תכתובות WhatsApp, הקלטות שירות או חוזים משפטיים בהקשר ארוך, ה-KV cache תופס נפח גדול, וחיפוש וקטורי על אלפי או מיליוני מסמכים מוסיף שכבת עלות נוספת. אם האלגוריתם של גוגל אכן מחזיק בייצור את מה שהוצג בבנצ'מרקים, הוא עשוי לאפשר לפרוס יותר יכולות על אותה חומרה, או לחלופין לקבל אותה רמת שירות בפחות שרתים.

מנקודת מבט של יישום בשטח, זה חשוב במיוחד בארכיטקטורות שמשלבות AI Agents עם WhatsApp Business API, שכבת תזמור ב-N8N ומאגר לקוחות כמו Zoho CRM. במערכות כאלה, כל הודעה נכנסת יכולה להפעיל שליפה של היסטוריית לקוח, מסמכים, FAQ, סטטוס עסקה ומדיניות פנימית. אם שכבת האחזור הווקטורית מהירה יותר, ואם מודל השפה יכול להחזיק הקשר ארוך יותר בזיכרון קטן יותר, מתקבל שיפור ישיר בזמן תגובה. ההערכה המקצועית שלי: ב-12 עד 18 החודשים הקרובים נראה מעבר מדיבור על "מודל גדול יותר" לשאלות תפעוליות של דחיסה, latency וניהול זיכרון — במיוחד אצל מי שבונים מערכות שירות ומכירה בזמן אמת.

ההשלכות לעסקים בישראל

בישראל, ההשפעה תהיה חזקה במיוחד בארבעה סוגי ארגונים: משרדי עורכי דין עם מאגרי מסמכים גדולים, סוכני ביטוח שמנהלים היסטוריית לקוח מרובת מסמכים, מרפאות פרטיות עם תקשורת רב-ערוצית, וחנויות אונליין שמפעילות תמיכה, קטלוג וחיפוש. למשל, משרד עורכי דין בתל אביב שמחבר מסמכי Word, PDF, תמלילי שיחות ונתוני לקוח ל-Zoho CRM, יכול להפעיל מנוע תשובות פנימי שמבוסס על חיפוש וקטורי ועל מודל שפה. אם הדחיסה מקטינה פי 6 את טביעת הזיכרון של הרכיב החישובי, אפשר להחזיק יותר תיקים פעילים לאותו שרת או לקצר זמני מענה לצוות.

גם בהיבט רגולטורי יש כאן משמעות. חוק הגנת הפרטיות בישראל ודרישות אבטחת מידע דוחפים עסקים רבים לצמצם מעבר מידע מיותר ולשלוט טוב יותר במיקום ובצורת העיבוד. ככל שמערכות AI צריכות פחות זיכרון ופחות העברות נתונים, כך קל יותר לתכנן ארכיטקטורה חסכונית ומבוקרת. עבור עסק ישראלי בינוני, פיילוט של חיפוש סמנטי עם מסמכים, CRM ו-WhatsApp יכול להתחיל בטווח של כ-₪4,000 עד ₪12,000 לאפיון והקמה ראשונית, ולאחר מכן עלות חודשית של מאות עד אלפי שקלים לכלי ענן, וקטור דאטה-בייס והרצות מודל. כאן נכנס היתרון של שילוב אוטומציה עסקית עם CRM חכם: לא רק להריץ מודל, אלא לחבר תהליך עסקי מלא מהודעת לקוח ועד תיעוד, שליפה ותגובה.

מה לעשות עכשיו: צעדים מעשיים לעסק ישראלי

  1. בדקו אם מערכות הליבה שלכם — Zoho CRM, HubSpot, Monday או מערכת פנימית — תומכות ב-API נגיש לשכבת חיפוש וקטורי.
  2. הריצו פיילוט של 14 יום על תהליך אחד בלבד: חיפוש תשובות ממסמכים, סיכום שיחות או מענה WhatsApp. תקציב ראשוני סביר: ₪2,000 עד ₪8,000, תלוי בכמות הדאטה ובמורכבות האינטגרציה.
  3. מדדו שלושה מספרים: זמן תגובה, עלות לכל 1,000 פניות, ואחוז תשובות שנדרשו להסלמה לנציג אנושי.
  4. תכננו ארכיטקטורה שמחברת מודל שפה, חיפוש וקטורי, N8N ו-Zoho CRM במקום להוסיף כלי נפרד לכל בעיה. אם אתם בונים חוויית שירות, בחנו גם סוכן וואטסאפ כחזית ללקוח.

מבט קדימה על דחיסת מודלים וחיפוש

TurboQuant הוא לא עוד עדכון אקדמי שיישאר במעבדה. אם המספרים שגוגל הציגה ב-ICLR 2026 וב-AISTATS 2026 יתורגמו למוצרים ולספריות שימושיות, עסקים יקבלו דרך ריאלית לבנות מערכות AI מהירות וזולות יותר. בשנה הקרובה כדאי לעקוב אחרי שילוב של דחיסה, חיפוש וקטורי וארכיטקטורות agentic. עבור עסקים בישראל, הסטאק שכדאי לבחון הוא AI Agents יחד עם WhatsApp Business API, Zoho CRM ו-N8N — כי שם הערך העסקי נמדד לא במאמר, אלא בזמן תגובה, עלות תפעול ואיכות השירות.

שאלות ותשובות

שאלות נפוצות

רוצים ליישם את זה בעסק שלכם?

באוטומציות AI אנחנו בונים סוכני AI ואוטומציות לעסקים בישראל. ראו את השירותים הרלוונטיים:

  • אוטומציה לעסקיםחיבור מערכות, חשבוניות ודשבורדים
  • בוט וואטסאפ לעסקWhatsApp Business API בישראל
  • סוכני AI לעסקיםסוכנים שמטפלים בלידים, שיחות ו-CRM
  • ניהול לידים אוטומטימענה מיידי, ניקוד וסינון אוטומטי

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של Google Research. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־Google Research

כל הכתבות מ־Google Research
האצת מודלי בינה מלאכותית על המכשיר: החידוש של גוגל ב-MTP
מחקר
אתמול
4 דקות
·מ־Google Research

האצת מודלי בינה מלאכותית על המכשיר: החידוש של גוגל ב-MTP

חברת Google הציגה פריצת דרך בארכיטקטורת מחשוב הקצה של מכשירי Pixel 9 ו-Pixel 10 באמצעות שילוב טכנולוגיית Multi-Token Prediction (MTP) במודל Gemini Nano v3 המקומי. פיתוח זה מאפשר להאיץ את מהירות הרצת המודלים על גבי המכשיר ביותר מ-50% ללא צורך במודל טיוטה חיצוני המכביד על הזיכרון. הארכיטקטורה החדשה, המכונה Zero-copy, עושה שימוש ישיר ב-KV cache של מודל הבסיס הקיים, ובכך חוסכת כ-130MB מזיכרון ה-RAM הדינמי ומפחיתה את צריכת האנרגיה של הסוללה, תוך שמירה על רמת דיוק ובטיחות גבוהה במשימות עיבוד שפה וסיכומי מידע.

GooglePixel 9Pixel 10
קרא עוד
אחזור ידע במודלי שפה: כיצד תהליכי חשיבה משפרים דיוק עובדתי?
מחקר
לפני 2 ימים
4 דקות
·מ־Google Research

אחזור ידע במודלי שפה: כיצד תהליכי חשיבה משפרים דיוק עובדתי?

מחקר חדש של Google Research (זרוע המחקר של גוגל) חושף כי הפעלת מנגנוני חשיבה (Reasoning) במודלים כמו Gemini-2.5 (מודל השפה של גוגל) משפרת באופן עקבי את היכולת לבצע אחזור ידע במודלי שפה. החוקרים זיהו שני מנגנונים: באפר חישובי וצימוד עובדתי, המאפשרים למודל לאחזר עובדות פשוטות מתוך הזיכרון הפנימי ללא צורך בחישובים מורכבים או בחיפוש חיצוני. עם זאת, המחקר מזהיר כי הזיה בודדת בשלבי הביניים של החשיבה פוגעת דרמטית בדיוק התשובה הסופית.

Zorik GekhmanJonathan HerzigGemini-2.5
קרא עוד
מיפוי סביבתי באמצעות בינה מלאכותית: מפיקסלים לתכנון שיקום הטבע
מחקר
16 ביוני 2026
4 דקות
·מ־Google Research

מיפוי סביבתי באמצעות בינה מלאכותית: מפיקסלים לתכנון שיקום הטבע

גוגל חשפה פריצת דרך בפרויקט Earth AI המאפשרת מעבר ממפות פיקסלים למידע וקטורי מפורט ברזולוציה של תת-מטר. המערכת שפותחה בשיתוף אוניברסיטת אוקספורד, מאפשרת מיפוי מדויק של גדרות חיות, קירות אבן וחורשות קטנות המהווים כלי קריטי לשיקום אקולוגי ולחישובי פחמן. עבור המגזר העסקי בישראל, טכנולוגיה זו מציעה הזדמנויות משמעותיות בתחומי הביטוח, הנדל״ן והחקלאות המדייקת, תוך התחשבות במגבלות חוק הגנת הפרטיות הישראלי.

Google Earth AIGoogle Earth EngineLeverhulme Centre for Nature Recovery
קרא עוד
אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל
מחקר
10 ביוני 2026
5 דקות
·מ־Google Research

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

חוקרי Google Research הציגו בוועידת AISTATS 2026 מסגרת עבודה מהפכנית בשם Regularized f-Divergence Kernel Tests, המיועדת לבצע אימות מחיקת מידע ממודלי בינה מלאכותית. השיטה החדשה מתגברת על כשלי הבדיקות הדו-מדגמיות המסורתיות (כמו MMD), ומאפשרת למבקרים חיצוניים לזהות דליפות מידע מקומיות ברמת דיוק חסרת תקדים. באמצעות שימוש במדדי שונות מתקדמים כמו Hockey-stick divergence ורגולריזציה של ליבות, המערכת מזהה הפרות פרטיות תוך שימוש בכמה אלפי דגימות בלבד בהשוואה למיליוני דגימות שנדרשו בעבר בשיטות כמו DP-Auditorium. פיתוח זה מעניק לעסקים הפועלים תחת רגולציות פרטיות מחמירות כלי מתמטי מוכח להבטחת עמידה בדרישות החוק.

AISTATS 2026Mónica RiberoAntonin Schrab
קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות
חוות שרתים בחלל: האם החזון של אילון מאסק הוא רק גימיק שיווקי?
ניתוח
לפני 7 דקות
4 דקות
·מ־TechCrunch

חוות שרתים בחלל: האם החזון של אילון מאסק הוא רק גימיק שיווקי?

בעוד תעשיית ה-AI מתמודדת עם מחסור חסר תקדים בכוח מחשוב, אילון מאסק מציע פתרון קיצוני של הקמת חוות שרתים בחלל באמצעות לווייני SpaceX (חברת תעופה והחלל של אילון מאסק). אולם מסאיושי סון, מייסד ומנכ"ל SoftBank (תאגיד ההשקעות היפני המסיבי), מביע ספקנות עמוקה באשר להיתכנות הכלכלית והמעשית של המהלך. סון טוען כי הפרויקט ייקח שנים רבות מדי בזמן שהקרב על ה-AI מוכרע ברגעים אלו ממש בכדור הארץ, ומבקרים מזהירים כי מדובר בעיקר באינטרס עסקי צר של מאסק להגדיל את נפח השיגורים של Starlink (רשת לווייני האינטרנט של SpaceX).

SoftBankSpaceXElon Musk
קרא עוד
שבבי AI מותאמים אישית לעסקים: מהפכת השבב Jalapeño
ניתוח
אתמול
4 דקות
·מ־TechCrunch

שבבי AI מותאמים אישית לעסקים: מהפכת השבב Jalapeño

על פי דיווח של TechCrunch, חברת OpenAI (מעבדת מחקר ופיתוח בינה מלאכותית אמריקאית) מפתחת את שבב ההסקה הייעודי Jalapeño בשיתוף עם חברת Broadcom, במטרה להפחית את תלותה בחברת Nvidia (יצרנית השבבים המובילה בעולם). מהלך זה מצטרף למגמה רחבה שבה ענקיות טכנולוגיה מפתחות שבבי AI מותאמים אישית לעסקים כדי להוזיל את עלויות המחשוב הגבוהות, המהוות כיום כ-80% מהוצאות הרצת המערכות. הוזלה זו, לצד גיוס של 650 מיליון דולר על ידי חברת Groq המתחרה, תנגיש סוכני בינה מלאכותית מהירים וזולים יותר עבור ארגונים וחברות בישראל.

OpenAIBroadcomNvidia
קרא עוד
בטיחות בינה מלאכותית לעסקים: האם גישת Anthropic בטוחה?
ניתוח
אתמול
6 דקות
·מ־Wired

בטיחות בינה מלאכותית לעסקים: האם גישת Anthropic בטוחה?

חברת הבינה המלאכותית Anthropic (חברת בינה מלאכותית אמריקאית) פועלת תחת האמונה כי הדרך היחידה להבטיח את בטיחות תחום ה-AI היא להוביל את חזית הפיתוח והמרוץ המסחרי. לפי פרסומים במגזין Wired, שוויה של החברה מוערך בכמעט טריליון דולר, והיא משתפת פעולה באופן הדוק עם הפנטגון ואף הטמיעה במודלים שלה (כמו Claude Fable 5) מנגנוני הגנה חסרי תקדים שעוררו ביקורת עזה. עבור עסקים ישראלים, השימוש במודלים המושפעים מהחלטות רגולטוריות וביטחוניות בארה"ב מחייב משנה זהירות, יישום פתרונות אוטומציה מבוזרים וארכיטקטורת מידע המגינה על פרטיות הלקוחות בהתאם לחוק הגנת הפרטיות הישראלי.

AnthropicOpenAISam Altman
קרא עוד
ניהול תקציב בינה מלאכותית: חברות בולמות בזבוז על משימות קטנות
ניתוח
לפני 3 ימים
4 דקות
·מ־TechCrunch

ניהול תקציב בינה מלאכותית: חברות בולמות בזבוז על משימות קטנות

מחקרים ונתונים שפורסמו לאחרונה, כולל חשיפה של 404 Media לגבי חברת הייעוץ Accenture, מראים כי חברות רבות מתמודדות עם עלייה בלתי נשלטת בהוצאות ה-AI שלהן. עובדים המשתמשים במודלים מתקדמים למשימות פשוטות כמו המרת קבצי PDF למצגות שוחקים במהירות את תקציבי ה-API של הארגונים, בתופעה המכונה "Tokenmaxxing". המנהלים הבכירים, בהם מנהלי כספים (CFOs), מדווחים כי העלויות הופכות לבלתי צפויות ללא החזר השקעה ברור, מה שמוביל למדיניות חדשה של "קיצוב טוקנים" והגבלת הגישה לכלים יקרים.

AccentureJustice Kwak404 Media
קרא עוד