Tesseract OCR

Scarica e installa Tesseract

  • Seleziona il tesseract-ocr-w64-setup-v5.3.x.exe (64 bit) file per scaricare l'installer eseguibile di Tesseract

  • Una volta scaricato, apri il file eseguibile e segui le istruzioni di installazione

circle-info

Assicurati di aver installato la versione a 64 bit di tesseract in C:\Program Files\Tesseract-OCR

File dati addestrati (Lingue)

Puoi scaricare il .traineddata file per la lingua di cui hai bisogno e posizionarlo nella directory di installazione di Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[qui] (questo dovrebbe essere lo stesso percorso in cui è installata la directory tessdata)

tessdata https://github.com/tesseract-ocr/tessdataarrow-up-right Velocità: Più veloce di tessdata-best Precisione: Leggermente meno precisa rispetto a tessdata-best

tessdata-best (Consigliato per i videogiochi) https://github.com/tesseract-ocr/tessdata_bestarrow-up-right Velocità: Più lenta Precisione: Più precisa

tessdata-fast https://github.com/tesseract-ocr/tessdata_fastarrow-up-right Velocità: Più veloce Precisione: Meno precisa

Modalità di segmentazione della pagina

La PSM ti permette di selezionare un metodo di segmentazione in base alla tua immagine specifica e all'ambiente in cui è stata catturata

Modalità di segmentazione della pagina

1

Rilevamento dell'orientamento e dello script (OSD) solamente.

2

Segmentazione automatica della pagina con OSD.

3

Segmentazione automatica della pagina, ma senza OSD o OCR. (non implementato)

4

Segmentazione completamente automatica della pagina, ma senza OSD. (Predefinito)

5

Assumi una singola colonna di testo di dimensioni variabili.

6

Assumi un singolo blocco uniforme di testo allineato verticalmente.

7

Assumi un singolo blocco uniforme di testo.

8

Considera l'immagine come una singola riga di testo.

9

Considera l'immagine come una singola parola.

10

Considera l'immagine come una singola parola in un cerchio.

11

Considera l'immagine come un singolo carattere.

12

Testo sparso. Trova il maggior numero possibile di testi in nessun ordine particolare.

13

Testo sparso con OSD.

14

Linea grezza. Considera l'immagine come una singola riga di testo, bypassando gli accorgimenti specifici di Tesseract.