תוכן עניינים:
הגדרה - מה המשמעות של זיהוי תווים אופטיים (OCR)?
זיהוי תווים אופטי (OCR) מתייחס הן לטכנולוגיה והן לתהליך הקריאה והמרה של תווים מודפסים, מודפסים או בכתב יד לטקסט המקודד במכונה או משהו שהמחשב יכול לתפעל. זוהי קבוצת משנה של זיהוי תמונות ומשמשת אותה באופן נרחב כצורת הזנת נתונים כאשר הקלט הוא מעין מסמך מודפס או רשומת נתונים מודפסת כגון דפי בנק, חשבוניות מכירה, דרכונים, קורות חיים וכרטיסי ביקור. המסמך נסרק או מצולמת תמונה וזה תלוי בתוכנית לזהות את התווים ולתת פלט בצורה של מסמך טקסט.
Techopedia מסביר זיהוי תווים אופטיים (OCR)
זיהוי תווים אופטי הוא זיהוי תווים ספציפיים לשפה על ידי מחשב על ידי ניתוח תמונה, שכבר ניתן לקריאה במחשב. לרוב זה נעשה על ידי צילום תמונה של המסמך תחילה על ידי סריקתו או צילום תמונה דיגיטלית. זה יוצר תמונת רסטר שמורכבת מנתונים שהמחשב מבין, ובאמצעות אלגוריתמים מתוכנתים ספציפית, שרובם משמשים בתחום הבינה המלאכותית, המחשב מזהה את התבניות שבתמונה, ובמקרה זה הדפוסים הם תווים. לאחר מכן התוכנית יוצרת או יוצאת קודי תווים, בדרך כלל ASCII, שקולים לתווים המוכרים מתמונת הקלט. יש לאמן את רוב תכניות ה- OCR כדי שהן יהיו טובות יותר בזיהוי תווים.
