מישהו מקיר תוכנת OCR חינמית?

gshell

New member
מישהו מקיר תוכנת OCR חינמית?

שניתן בעזרתה לסרוק ספרות בצורה דיגיטלית כקובץ WORD
 

Unicorn98

New member
אני בספק אם יש חינמית, אלו תוכנות

שיקר יחסית לייצר. מה שכן, אולי כדאי לחפש demos או התקנות ניסיון ל-30 יום, אם זו משימה חד פעמית (התוכנה הטובה ביותר בתחום נחשבת להיות scansoft omnipage). לסייג - התוכנה היחידה שמתמודדת עם OCR של עברית היא ליגטורה (ligature), ולה אני כמעט משוכנע שאין דמו ל-30 יום. באנגלית - סביר שבכל זאת תמצא.
 
מעניין... אף פעם לא שאלתי את עצמי את זה

אולי כדאי לנסות דרך אתרים של חוקרים שפיתחו לזה אלגוריתמים במסגרת אקדמאית? אני יודעת שאצלנו באדינבורו עובדים בין השאר על זה, וגם ב-MIT ובאוניברסיטת מנצ'סטר יש מחקר יחסית נרחב בתחום. כדאי גם לחפור קצת בפרוייקט הספרים של גוגל, ובפרוייקט מליון הספרים. שניהם נסיונות להעביר כמויות אדירות של מידע דרך OCR. אולי תמצא שם משהו על כלי שניתן להוריד חינם. ואם תמצא, אני אישית אשמח אם תספר לנו.
 

Imperia

New member
בעברית, לא ממש. באנגלית, יותר

למרות שמבחינה "מדעית" OCR זה בעיה "פתורה" כבר הרבה שנים, בפועל OCR טוב דורש הרבה עבודה של טיפול בכל מיני מקרי קצה, כמו פונטים מוזרים, הדפסה לא מושלמת, סריקה לא מושלמת, דפים מלוכלכים... בעברית כפי שנאמר התוכנה העיקרית זה ליגטורה והיא עולה הרבה. יש ניסיון לייצר תוכנת קוד פתוח בשם hOcr, חוץ מזה שהיא לא ממש חזקה, היא מיועדת בעיקר ללינוקס, להתקין אותה על חלונות זה משהו בין לא אפשרי למסובך מאד. באנגלית - בתוך האופיס בגרסאות החדשות (לא יודעת ממתי. נראה לי מ-2003) יש OCR. אתה צריך את הרכיב שקוראים לו Microsoft Office Document Imaging. אם יש לך במקרה acrobat writer (לדוגמה יש באוניברסיטה רישיון) - גם לו יש רכיב של OCR. יש גם תוכנות חינם ממש, אבל כנראה שהן לא שוות הרבה.
 
למעלה