Hocr - הפיכת תמונה עם אותיות עבריות לקובץ טקסט

מתוך ויקיספר, אוסף הספרים והמדריכים החופשי


הלוגו של תכנת hocr הוכן ע"י שלומי ישראל

למי הספר מיועד?[עריכה]

הספר מיועד למשתמשים המעוניינים לסרוק ספרים ולהפוך אותם לקבצי טקסט. סטודנטים שצריכים להקליד חומר רב עבור עבודה, סופרים המעוניינים להמיר את אוסף השירה המודפס שלהם לפורמט 'מודרני' יותר המאפשר חיפוש ואיחזור קל של מידע, חברות שרוצות למחשב את ארכיון המסמכים שלהן וכל משתמש אחר.

להפיכת טקסט מודפס לטקסט ממוחשב יתרונות רבים. אחד היתרונות בהפיכת דפים מודפסים לדפי מחשב הוא החיסכון במקום, ניתן להכניס ספריה שלמה לתוך תקליטור בודד. יתרונות נוספים של המרת דפים מודפסים לדפי מחשב הם היכולת לחפש ולמצוא בקלות מסמכים ע"ׁי מילות חיפוש, תאריכים ומאפיינים נוספים וכן היכולת לשלוח ולהפיץ בקלות את החומר ע"י שימוש באמצעי תקשורת אלקטרוניים. כאשר מדובר בטקסטים נדירים או חשובים, המרת הטקסט המודפס לחומר מחשב מאפשרת שמירה על המקור המודפס ללא צורך לגשת אליו לצורך קריאת החומר.

המנשק הגרפי של hocr, הנדסת אנוש ועיצוב ע"י יובל טאני

איזה ידע קודם נדרש?[עריכה]

נסיון בסיסי בעבודה עם מחשבים, להבנת ההוראות.

ראו גם[עריכה]

קישורים חיצוניים[עריכה]