יותר מעשור ש-GPU של Nvidia תומכות בכל התקדמות מרכזית בבינה מלאכותית מודרנית. אולם עכשיו, מעמד זה מאוים. מודלים מתקדמים כמו Gemini 3 של גוגל ו-Claude 4.5 Opus של Anthropic אומנו לא על חומרת Nvidia, אלא על יחידות העיבוד הטנסורים החדשות TPUv7 מבוססות Ironwood. צעד זה מסמן כי אלטרנטיבה ריאלית לערימת ה-GPU ב-AI כבר כאן, עם השלכות אמיתיות על הכלכלה והארכיטקטורה של אימון בקנה מידה עצום.
מערכת CUDA של Nvidia, שמספקת גישה לארכיטקטורת ה-GPU המקבילה העצומה, יצרה "תעלת CUDA" שמקשה על מעבר לפלטפורמות אחרות בגלל תלות בכלי התוכנה של Nvidia. יתרון זה, בשילוב עם יתרון ראשון בשוק, אפשר לחברה להגיע למרווח גולמי של 75%. לעומת זאת, TPU תוכננו מראש כשבבים מיועדים ללמידת מכונה. עם כל דור, גוגל דחפה קדימה בהאצת AI בקנה מידה גדול, וכעת TPUv7 - שמאחורי שני המודלים המתקדמים ביותר - מסמן אסטרטגיה רחבה יותר לאתגר את שליטת Nvidia.
GPU ו-TPU מאיצות למידת מכונה, אך משקפות פילוסופיות עיצוב שונות: GPU הן מעבדים מקבילים כלליים, בעוד TPU הן מערכות מיועדות כמעט אך ורק לכפל מטריצות בקנה מידה גדול. ב-TPUv7, גוגל לקחה זאת צעד קדימה עם שילוב חיבורים מהירים ישירות בשבב, המאפשרים לפודים של TPU להתרחב כמו מחשב על יחיד ומפחיתים עלויות ועיכובים של אשכולות GPU. "TPU מתוכננות כ'מערכת' שלמה ולא רק כשבב", אמר ול ברקוביץ', ראש AI ב-WEKA, ל-VentureBeat.
גוגל פונה ממסורת של הגבלת גישה ל-TPU דרך השכרה בענן בלבד, ומציעה כעת את החומרה ישירות ללקוחות חיצוניים. לקוחות יכולים לבחור בין הוצאה תפעולית (שכירה בענן) להוצאה הונית (רכישה). עסקה מרכזית היא עם Anthropic, שתקבל גישה למיליון שבבי TPUv7 - יותר מגיגה-וואט כוח חישוב. דרך Broadcom, כ-400,000 שבבים נמכרים ישירות, והשאר משווקים דרך חוזי ענן. מחויבות זו מוסיפה מיליארדים להכנסות גוגל ומקשרת מתחרה מרכזית של OpenAI לאקוסיסטמה של גוגל.
TPUv7 תומכות בשילוב PyTorch מקורי, כולל ביצוע מיידי, תמיכה מלאה ב-API מפוזרים, torch.compile ותמיכה בגרעיני TPU מותאמים. גוגל תורמת גם ל-vLLM ו-SGLang, מה שמקל על מפתחים להחליף חומרה ללא כתיבת קוד מחדש. ניתוח של SemiAnalysis מראה כי TPUv7 מציעות תפוקה טובה יותר לדולר באימון והסקה, עם TCO נמוך ב-44% ממערכות Nvidia פנימיות בגוגל, וב-30% ללקוחות חיצוניים. "כשעלות היא פרמטר מרכזי, TPU מתאימות לפרויקטי AI בקנה מידה עצום, עם חיסכון של 30-50% ב-TCO", אמר ברקוביץ'.
יתרונות TPU בולטים בעלויות תפעול, צריכת חשמל וקירור, ומשפיעים כבר על השוק: OpenAI קיבלה הנחה של 30% מחומרת Nvidia ומשלבת TPU בענן גוגל; Meta בשיחות מתקדמות לרכישת TPU. אולם, TPU פחות גמישות מ-GPU, שמתאימות למגוון אלגוריתמים ומשימות לא-AI. מעבר מ-GPU יקר וזמן רב, במיוחד לצוותים עם צינורות CUDA קיימים. ברקוביץ' ממליץ על GPU לעבודה מהירה, תשתיות סטנדרטיות וכישרונות זמינים יותר.
עבור ארגונים עם עומסי טנסורים כבדים, TPU מציעות יתרון; אחרים עשויים להעדיף גישה היברידית. גוגל מדווחת על ביקוש גובר לשתי הטכנולוגיות, ומציעה בחירה גמישה. עתיד ארכיטקטורת AI עשוי להיות היברידי, עם Nvidia, גוגל ואמזון מתחרות.