Tesseract OCR

Unduh & Pasang Tesseract

  • Pilih tesseract-ocr-w64-setup-v5.3.x.exe (64 bit) file untuk mengunduh penginstal executable Tesseract

  • Setelah diunduh, buka file executable dan ikuti petunjuk instalasi

circle-info

Pastikan Anda telah menginstal tesseract-64bit di C:\Program Files\Tesseract-OCR

Berkas Data Terlatih (Bahasa)

Anda dapat mengunduh .traineddata file untuk bahasa yang Anda butuhkan dan letakkan di direktori instalasi Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[di sini] (ini seharusnya sama dengan tempat direktori tessdata diinstal)

tessdata https://github.com/tesseract-ocr/tessdataarrow-up-right Kecepatan : Lebih cepat dari tessdata-best Akurasi : Sedikit kurang akurat daripada tessdata-best

tessdata-best (Direkomendasikan untuk permainan video) https://github.com/tesseract-ocr/tessdata_bestarrow-up-right Kecepatan : Paling lambat Akurasi : Paling akurat

tessdata-fast https://github.com/tesseract-ocr/tessdata_fastarrow-up-right Kecepatan : Paling cepat Akurasi : Paling tidak akurat

Mode Segmentasi Halaman

PSM memungkinkan Anda memilih metode segmentasi tergantung pada gambar tertentu dan lingkungan tempat gambar tersebut diambil

mode segmentasi halaman

1

Deteksi orientasi dan skrip (OSD) saja.

2

Segmentasi halaman otomatis dengan OSD.

3

Segmentasi halaman otomatis, tetapi tanpa OSD atau OCR. (tidak diimplementasikan)

4

Segmentasi halaman otomatis sepenuhnya, tetapi tanpa OSD. (Default)

5

Menganggap satu kolom teks dengan ukuran yang bervariasi.

6

Menganggap satu blok seragam teks yang tersusun secara vertikal.

7

Menganggap satu blok seragam teks.

8

Perlakukan gambar sebagai satu baris teks.

9

Perlakukan gambar sebagai satu kata.

10

Perlakukan gambar sebagai satu kata dalam lingkaran.

11

Perlakukan gambar sebagai satu karakter.

12

Teks jarang. Temukan sebanyak mungkin teks tanpa urutan tertentu.

13

Teks jarang dengan OSD.

14

Baris mentah. Perlakukan gambar sebagai satu baris teks, melewati penyesuaian yang khusus untuk Tesseract.