שילוב OCR ו-AI: צינור להעשרת מאגרי נתונים היסטוריים
חוקרים מאוניברסיטת ליידן מפתחים שיטה אוטומטית להדיגיטציה מדויקת של מסמכים עתיקים – עם דיוק של 94% בקישור נתונים
✨תקציר מנהלים
נקודות עיקריות
OCR השיג CER 1.08% ו-WER 5.06% על מסמכים היסטוריים.
חילוץ JSON בדיוק 63-65% עם תיקון AI גנרטיבי.
קישור רשומות ב-94% (מאויש) ו-81% (אוטומטי).
מתמודד עם שונות עיצוב ומונחים.
תורם להומניטיס דיגיטליות ועיבוד ארכיונים.
שילוב OCR ו-AI: צינור להעשרת מאגרי נתונים היסטוריים
- OCR השיג CER 1.08% ו-WER 5.06% על מסמכים היסטוריים.
- חילוץ JSON בדיוק 63-65% עם תיקון AI גנרטיבי.
- קישור רשומות ב-94% (מאויש) ו-81% (אוטומטי).
- מתמודד עם שונות עיצוב ומונחים.
- תורם להומניטיס דיגיטליות ועיבוד ארכיונים.
שאלות ותשובות
שאלות נפוצות
אהבתם את הכתבה?
הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל
עוד כתבות שיעניינו אותך
לכל הכתבותHarmTransform: הסוואת שאילתות מזיקות בדיון רב-סוכנים
בעידן שבו דגמי שפה גדולים (LLM) שולטים בשיחות דיגיטליות, מנגנוני הבטיחות שלהם חסומים בפני תכנים מסוכנים גלויים – אך נכשלים מול הסוואות מתוחכמות. HarmTransform מציעה פתרון חדשני. קראו עכשיו על המסגרת שמשפרת אימון בטיחות.
סוכני AI מבוססי LLM משנים ניהול אנרגיה בבניינים חכמים
חוקרים פיתחו מסגרת לסוכני AI מבוססי LLM לניהול אנרגיה בבניינים חכמים. המערכת כוללת שלושה מודולים: תפיסה, שליטה מרכזית ואקשן. בדיקות הראו דיוק גבוה בשליטה במכשירים (86%) וניתוח אנרגיה (77%). קראו עכשיו על ההשלכות העסקיות.
STAgent: מודל AI סוכני חדש להבנת מרחב-זמן
בעידן שבו תכנון נסיעות עסקיות דורש שילוב מדויק של מיקום וזמן, STAgent – מודל AI סוכני חדש – פותר משימות מורכבות כמו תכנון מסלולים. קראו את הדוח המלא עכשיו!
פריצת דרך: יצירת קוד מבנגלית לפייתון עם BanglaCodeAct
מודלי שפה גדולים יוצרים קוד מבנגלית לפייתון בדיוק של 94% בעזרת BanglaCodeAct. קראו על הפריצה החדשה!