סוכני AI מבוססי LLMs משנים אוטומציה, אך אמינות כלים חסרה. מסגרת אבחון חדשה בודקת 1,980 מקרים ומגלה: Qwen2.5:32b מושלם כמו GPT-4. קראו עכשיו! (48 מילים)
בעידן שבו מודלי שפה גדולים עוברים כיוונון עדין רציף, חוקרים חושפים התקפות דלת אחורית עקשניות כמו P-Trojan ששורדות מעל 99% מהעדכונים. קראו על האיום וההגנות הנדרשות. (112 מילים)