בעידן שבו מודלי שפה גדולים (LLM) שולטים בעיבוד טקסט, הם עדיין נכשלים במשימות הדורשות ציות קפדני לכללים, דטרמיניזם ואפשרות ביקורת. חוקרים מציגים את Logic Sketch Prompting (LSP) – מסגרת פרומפטינג קלה המשלבת משתנים ממוינים, מעריכי תנאים דטרמיניסטיים ומאמת מבוסס כללים לייצור תפוקות ניתנות למעקב ולחזרה. השיטה מבטיחה אמינות גבוהה יותר בתחומים רגישים כמו רפואה ורגולציה, מבלי לפגוע בביצועים.
LSP פועלת על ידי הגדרת משתנים עם סוגים מוגדרים מראש, הערכת תנאים בצורה דטרמיניסטית לחלוטין ומאמת כללים שמבקר את התהליך שלב אחר שלב. החוקרים בדקו אותה בשתי משימות ציות לוגי פרמקולוגי, המשמשות לבדיקת עמידה בכללי תרופות מורכבים. המבחנים נערכו על שלושה מודלים פתוחים: Gemma 2, Mistral ו-Llama 3. בכל המקרים, LSP השיגה דיוק של 0.83 עד 0.89 וציון F1 זהה, תוצאות מרשימות שמדגישות את יעילותה.
לשם השוואה, פרומפטינג אפס-שוט השיג 0.24 עד 0.60, פרומפטינג תמציתי 0.16 עד 0.30, ושרשרת מחשבה (Chain of Thought) 0.56 עד 0.75. מבחני McNemar אישרו שיפור סטטיסטי משמעותי ל-LSP ברוב ההשוואות (p < 0.01). התוצאות מראות כי LSP משפרת דטרמיניזם, פרשנות ועקביות, מה שהופך אותה לכלי אידיאלי למערכות תמיכת החלטה קריטיות.
השיטה מציעה יתרון משמעותי על פני שיטות פרומפטינג מסורתיות, שכן היא מספקת תהליך שקוף שניתן לבקר ולשחזר. בתחומים כמו פארמה ובריאות, שבהם טעויות עלולות להיות קטלניות, LSP יכולה להוות פריצת דרך. בישראל, שבה חברות הייטק וסטארט-אפים מובילות בפיתוח AI רפואי, השיטה רלוונטית במיוחד לחברות המפתחות כלים רגולטוריים.
עבור מנהלי עסקים ומפתחי AI, LSP מציעה דרך פשוטה לשדרג מערכות קיימות. כדאי לבדוק אותה ביישומים מקומיים ולשלב בכלים הדורשים אמינות גבוהה. האם LSP תהפוך לסטנדרט חדש? המחקר הזה מצביע על כך.