מחקר19 בדצמבר 20252 דקות·מ־arXiv cs.AIהתקפות דלת אחורית עקשניות ב-LLMs: איום ששרוד כיוונוןבעידן שבו מודלי שפה גדולים עוברים כיוונון עדין רציף, חוקרים חושפים התקפות דלת אחורית עקשניות כמו P-Trojan ששורדות מעל 99% מהעדכונים. קראו על האיום וההגנות הנדרשות. (112 מילים)P-TrojanQwen2.5LLaMA3קרא עוד