Tesseract OCR
تنزيل وتثبيت Tesseract
قم بزيارة Tesseract في UB Mannheim
اختر tesseract-ocr-w64-setup-v5.3.x.exe (64 بت) ملف لتنزيل مثبت Tesseract التنفيذي
بمجرد تنزيله، افتح الملف التنفيذي وتبع تعليمات التثبيت
تأكد من أنك قمت بتثبيت tesseract-64bit في C:\Program Files\Tesseract-OCR
ملفات البيانات المدربة (اللغات)
يمكنك تنزيل .traineddata الملف للغة التي تحتاجها ووضعه في دليل تثبيت Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[هنا]
(يجب أن يكون هذا نفس المكان الذي تم تثبيت دليل tessdata فيه)
tessdata https://github.com/tesseract-ocr/tessdata السرعة: أسرع من tessdata-best الدقة: أقل دقة بقليل من tessdata-best
tessdata-best
(موصى به لألعاب الفيديو)https://github.com/tesseract-ocr/tessdata_best السرعة: الأبطأ الدقة: الأكثر دقة
tessdata-fast https://github.com/tesseract-ocr/tessdata_fast السرعة: الأسرع الدقة: الأقل دقة
وضعية تقسيم الصفحة
تسمح لك PSM باختيار طريقة تقسيم اعتمادًا على صورتك الخاصة والبيئة التي تم التقاطها فيها
1
الكشف عن الاتجاه والنص/الخط (OSD) فقط.
2
تقسيم الصفحة التلقائي مع OSD.
3
تقسيم الصفحة التلقائي، ولكن بدون OSD أو OCR. (غير منفذ)
4
تقسيم الصفحة التلقائي بالكامل، لكن بدون OSD. (الإعداد الافتراضي)
5
افتراض عمود واحد من النص بأحجام متغيرة.
6
افتراض كتلة واحدة متسقة من النص المحاذي عمودياً.
7
افتراض كتلة واحدة متسقة من النص.
8
اعتبر الصورة كسطر نص واحد.
9
اعتبر الصورة ككلمة واحدة.
10
اعتبر الصورة ككلمة واحدة داخل دائرة.
11
اعتبر الصورة كحرف واحد.
12
نص متفرق. اعثر على أكبر قدر ممكن من النص دون ترتيب معين.
13
نص متفرق مع OSD.
14
سطر خام. اعتبر الصورة كسطر نص واحد، متجاوزًا الحيل الخاصة بـ Tesseract.