מחקר
2 דקות
מ־arXiv cs.AI
GSA: תשומת לב מדוללת משוערת למודלי שפה ארוכי הקשר
בעידן שבו מודלי שפה גדולים מתמודדים עם הקשרים ארוכים במיוחד, העומס החישובי של מנגנוני תשומת הלב הופך למכשול מרכזי. חוקרים מציגים GSA – תשומת לב מדוללת משוערת שמשלבת יעילות ויציבות. קראו את הפרטים המלאים עכשיו! (112 מילים)
קרא עוד