Tesseract OCR

تنزيل وتثبيت Tesseract

  • اختر tesseract-ocr-w64-setup-v5.3.x.exe (64 بت) ملف لتنزيل مثبت Tesseract التنفيذي

  • بمجرد تنزيله، افتح الملف التنفيذي وتبع تعليمات التثبيت

circle-info

تأكد من أنك قمت بتثبيت tesseract-64bit في C:\Program Files\Tesseract-OCR

ملفات البيانات المدربة (اللغات)

يمكنك تنزيل .traineddata الملف للغة التي تحتاجها ووضعه في دليل تثبيت Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[هنا] (يجب أن يكون هذا نفس المكان الذي تم تثبيت دليل tessdata فيه)

tessdata https://github.com/tesseract-ocr/tessdataarrow-up-right السرعة: أسرع من tessdata-best الدقة: أقل دقة بقليل من tessdata-best

tessdata-best (موصى به لألعاب الفيديو) https://github.com/tesseract-ocr/tessdata_bestarrow-up-right السرعة: الأبطأ الدقة: الأكثر دقة

tessdata-fast https://github.com/tesseract-ocr/tessdata_fastarrow-up-right السرعة: الأسرع الدقة: الأقل دقة

وضعية تقسيم الصفحة

تسمح لك PSM باختيار طريقة تقسيم اعتمادًا على صورتك الخاصة والبيئة التي تم التقاطها فيها

وضعيات تقسيم الصفحة

1

الكشف عن الاتجاه والنص/الخط (OSD) فقط.

2

تقسيم الصفحة التلقائي مع OSD.

3

تقسيم الصفحة التلقائي، ولكن بدون OSD أو OCR. (غير منفذ)

4

تقسيم الصفحة التلقائي بالكامل، لكن بدون OSD. (الإعداد الافتراضي)

5

افتراض عمود واحد من النص بأحجام متغيرة.

6

افتراض كتلة واحدة متسقة من النص المحاذي عمودياً.

7

افتراض كتلة واحدة متسقة من النص.

8

اعتبر الصورة كسطر نص واحد.

9

اعتبر الصورة ككلمة واحدة.

10

اعتبر الصورة ككلمة واحدة داخل دائرة.

11

اعتبر الصورة كحرف واحد.

12

نص متفرق. اعثر على أكبر قدر ممكن من النص دون ترتيب معين.

13

نص متفرق مع OSD.

14

سطر خام. اعتبر الصورة كسطر نص واحد، متجاوزًا الحيل الخاصة بـ Tesseract.