Tesseract OCR
Scarica e installa Tesseract
Visita il Tesseract presso UB Mannheim
Seleziona il tesseract-ocr-w64-setup-v5.3.x.exe (64 bit) file per scaricare l'installer eseguibile di Tesseract
Una volta scaricato, apri il file eseguibile e segui le istruzioni di installazione
Assicurati di aver installato la versione a 64 bit di tesseract in C:\Program Files\Tesseract-OCR
File dati addestrati (Lingue)
Puoi scaricare il .traineddata file per la lingua di cui hai bisogno e posizionarlo nella directory di installazione di Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[qui]
(questo dovrebbe essere lo stesso percorso in cui è installata la directory tessdata)
tessdata https://github.com/tesseract-ocr/tessdata Velocità: Più veloce di tessdata-best Precisione: Leggermente meno precisa rispetto a tessdata-best
tessdata-best
(Consigliato per i videogiochi)https://github.com/tesseract-ocr/tessdata_best Velocità: Più lenta Precisione: Più precisa
tessdata-fast https://github.com/tesseract-ocr/tessdata_fast Velocità: Più veloce Precisione: Meno precisa
Modalità di segmentazione della pagina
La PSM ti permette di selezionare un metodo di segmentazione in base alla tua immagine specifica e all'ambiente in cui è stata catturata
1
Rilevamento dell'orientamento e dello script (OSD) solamente.
2
Segmentazione automatica della pagina con OSD.
3
Segmentazione automatica della pagina, ma senza OSD o OCR. (non implementato)
4
Segmentazione completamente automatica della pagina, ma senza OSD. (Predefinito)
5
Assumi una singola colonna di testo di dimensioni variabili.
6
Assumi un singolo blocco uniforme di testo allineato verticalmente.
7
Assumi un singolo blocco uniforme di testo.
8
Considera l'immagine come una singola riga di testo.
9
Considera l'immagine come una singola parola.
10
Considera l'immagine come una singola parola in un cerchio.
11
Considera l'immagine come un singolo carattere.
12
Testo sparso. Trova il maggior numero possibile di testi in nessun ordine particolare.
13
Testo sparso con OSD.
14
Linea grezza. Considera l'immagine come una singola riga di testo, bypassando gli accorgimenti specifici di Tesseract.