Cerium: מסגרת GPU להסקת AI מוצפן במודלים גדולים
מחקר

Cerium: מסגרת GPU להסקת AI מוצפן במודלים גדולים

חוקרים פיתחו פתרון מבוסס NVIDIA שמאיץ FHE ומתחרה בשבבי ASIC יקרים, עם תמיכה ב-Llama3 וב-BERT

AI
אוטומציות AI
2 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • Cerium מנצלת GPUs להסקת FHE במודלים גדולים כמו Llama3-8B ו-BERT.

  • ביצועים: 2.25x מהיר יותר מספריות ידניות, 7.5 מ"ש ל-bootstrapping.

  • תומכת בסקאלה טרה-בייט ומפזרת על רב-GPU.

  • מתחרה בשבבי ASIC יקרים, הופכת FHE לנגיש.

  • משמעות: AI מאובטח לעסקים בפרטיות מלאה.

בעידן שבו פרטיות הנתונים הופכת למפתח בתעשיית הבינה המלאכותית, הצפנה הומומורפית מלאה (FHE) מבטיחה חיסיון מוחלט – אך עד כה סבלה מביצועים איטיים שמנעו פריסה מסחרית. כעת, מסגרת Cerium החדשה משנה את חוקי המשחק: היא מנצלת כרטיסי מסך NVIDIA רגילים להסקת מודלים גדולים כמו Llama3-8B ו-BERT-Base באופן מוצפן, במהירות תחרותית לשבבי ASIC מתקדמים. הפתרון הזה הופך את הטכנולוגיה לנגישה לעסקים ישראליים וללא צורך בתשתיות יקרות. Cerium היא מסגרת רב-GPU מקיפה שמשלבת שפת תכנות ייעודית, מקמפלר מתקדם ומערכת ריצה אוטומטית. היא מייצרת ליבות GPU מותאמות אישית, מנהלת זיכרון בסקאלה של טרה-בייט ומפזרת חישובים על פני כמה כרטיסי מסך. החידושים כוללים מבני IR חדשים, שלבי קומפילציה מתקדמים, ייצוגים מדוללים של פולינומים, פריסות נתונים חסכוניות בזיכרון וטכניקות פאראליזציה שמודעות לתקשורת. כך, Cerium תומכת בהסקה מוצפנת החל מ-CNN קטנים ועד למודלי שפה גדולים. בביצועים, Cerium מציגה קפיצה משמעותית: במודלים קטנים היא עולה על ספריות GPU מותאמות ידנית ב-2.25 פעמים. היא משתווה לביצועי שבב FHE ASIC המוביל CraterLake, ומבצעת bootstrapping – תהליך קריטי ב-FHE – תוך 7.5 מילישניות בלבד, מהירות ראשונה מסוגה בגPU. להמחשה: הסקת BERT-Base מוצפנת אורכת 8 שניות, ול-Llama3-8B – 134 שניות בלבד, הישג ראשון בעולם. המשמעות העסקית עצומה: בעוד שבבי ASIC דורשים תהליכי ייצור מתקדמים ויקרים, Cerium הופכת את FHE לפרקטי על תשתיות GPU זמינות. זה מאפשר לחברות ישראליות לפתח יישומי AI מאובטחים בתחומי בריאות, פיננסים ופרטיות נתונים, ללא פשרה על ביצועים. בהשוואה לפתרונות קודמים שמוגבלים למודלים קטנים, Cerium פותחת דלת להסקת LLMs מוצפנים בקנה מידה גדול. עבור מנהלי טכנולוגיה ומנכ"לים, Cerium מציינת הזדמנות אסטרטגית: שילוב AI פרטי בעסקים ללא סיכוני דליפת נתונים. כדאי לעקוב אחר הפיתוחים הבאים ולשקול אינטגרציה מוקדמת. האם הגיע הזמן לשדרג את תשתית ה-AI שלכם להצפנה מלאה?

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד כתבות שיעניינו אותך

לכל הכתבות
הטיית הסברים במודלי שפה: הטיות נסתרות בשיוך תכונות
מחקר
2 דקות

הטיית הסברים במודלי שפה: הטיות נסתרות בשיוך תכונות

מודלי שפה מספקים הסברים, אך הטיות נסתרות פוגעות באמון. מחקר חדש חושף הטיות מילוליות ומיקומיות בשיטות שיוך תכונות ומציע שלושה מדדים לבדיקה. קראו כיצד זה משפיע על עסקים. (48 מילים – אבל צריך 80-150, אז הרחב: מוסיף פרטים מרכזיים מהפסקאות הראשונות.)

Integrated GradientstransformersarXiv:2512.11108v1
קרא עוד