בעידן שבו סוכני AI מתחילים לשנות את עולם הפיתוח, חוקר מ-Anthropic שחרר 16 מופעים של דגם Claude Opus 4.6 על קוד משותף עם פיקוח מינימלי, במשימה לבנות קומפיילר C מאפס. על פי הדיווח בבלוג של החוקר ניקולס קרליני, התהליך נמשך שבועיים וכלל כ-2,000 מפגשי קוד Claude, בעלות של כ-20,000 דולר בשירותי API. התוצאה: קומפיילר מבוסס Rust בן 100,000 שורות קוד שמסוגל לבנות גרסת לינוקס 6.9 על ארכיטקטורות x86, ARM ו-RISC-V. זהו ניסוי נועז שמדגים את הפוטנציאל של סוכני AI בעבודה קבוצתית.
הניסוי התבצע כך: כל אחד מ-16 סוכני ה-Claude קיבל משימה ספציפית בתהליך הבנייה, בעודם עובדים על בסיס קוד משותף. למרות פיקוח מינימלי מצד החוקר, הסוכנים הצליחו לייצר קומפיילר תקין שמבנה kernel של לינוקס 6.9 bootable. Anthropic מדווחת כי זהו צעד משמעותי לקראת כלים רב-סוכניים, במיוחד לאור ההשקות האחרונות של OpenAI ו-Anthropic בכלים כאלה. העלות הגבוהה מדגישה את האתגרים הנוכחיים בהפעלת AI בקנה מידה גדול.
הקומפיילר שנבנה הוא מבוסס Rust, שפת תכנות בטוחה וביצועית, והוא תומך בשלוש ארכיטקטורות מרכזיות: x86 למחשבים אישיים, ARM למכשירים ניידים ו-RISC-V לעתיד הפתוח. לפי קרליני, הסוכנים הצליחו להתמודד עם משימות מורכבות כמו ניתוח קוד, כתיבה ותיקון באופן אוטונומי. זהו הישג טכני מרשים, אך עם הסתייגויות: הניסוי דרש השקעה כספית ניכרת והיה מוגבל למשימה ספציפית.
בהקשר רחב יותר, הניסוי הזה מצביע על מגמה גוברת של סוכני AI בפיתוח תוכנה. בעוד OpenAI משיקה כלים רב-סוכניים, Anthropic מוכיחה יכולות מתקדמות ב-Claude. עבור עסקים ישראליים בפיתוח תוכנה, זה פותח אפשרויות להאצת פרויקטים מורכבים, אך גם מעלה שאלות על עלויות ועל אמינות. בישראל, שבה חברות כמו Mobileye ו-Wix משקיעות ב-AI, ניסויים כאלה יכולים להוות השראה.
המשמעות העסקית ברורה: סוכני AI כמו Claude יכולים להפחית זמן פיתוח בקני מידה גדולים, אך דורשים תשתית חזקה. מנהלי טכנולוגיה צריכים לשקול אימוץ כלים כאלה בזהירות, תוך בדיקת ROI. השאלה המרכזית: האם סוכני AI יחליפו מתכנתים, או רק יעזרו להם? קראו את המאמר המלא לפרטים נוספים.