Tesseract OCR

Tesseract herunterladen & installieren

  • Wählen Sie die tesseract-ocr-w64-setup-v5.3.x.exe (64 Bit) Datei, um den ausführbaren Tesseract-Installer herunterzuladen

  • Nachdem der Download abgeschlossen ist, öffnen Sie die ausführbare Datei und folgen Sie den Installationsanweisungen

circle-info

Stellen Sie sicher, dass Sie das 64-Bit-Tesseract in C:\Program Files\Tesseract-OCR installiert haben

Trainingsdaten-Dateien (Sprachen)

Sie können die .traineddata Datei für die benötigte Sprache herunterladen und in das Installationsverzeichnis von Tesseract OCR legen C:\Program Files\Tesseract-OCR\tessdata\[hier] (dies sollte dasselbe Verzeichnis sein, in dem das tessdata-Verzeichnis installiert ist)

tessdata https://github.com/tesseract-ocr/tessdataarrow-up-right Geschwindigkeit : Schneller als tessdata-best Genauigkeit : Etwas weniger genau als tessdata-best

tessdata-best (Empfohlen für Videospiele) https://github.com/tesseract-ocr/tessdata_bestarrow-up-right Geschwindigkeit : Am langsamsten Genauigkeit : Am genauesten

tessdata-fast https://github.com/tesseract-ocr/tessdata_fastarrow-up-right Geschwindigkeit : Am schnellsten Genauigkeit : Am wenigsten genau

Seiten-Segmentierungs-Modi

Der PSM ermöglicht es Ihnen, eine Segmentierungsmethode auszuwählen, die von Ihrem speziellen Bild und der Umgebung abhängt, in der es aufgenommen wurde

Seiten-Segmentierungsmodi

1

Nur Orientierungserkennung und Schrifterkennung (OSD).

2

Automatische Seitensegmentierung mit OSD.

3

Automatische Seitensegmentierung, aber kein OSD oder OCR. (nicht implementiert)

4

Vollautomatische Seitensegmentierung, aber kein OSD. (Standard)

5

Gehe von einer einzelnen Spalte mit Text variabler Größe aus.

6

Gehe von einem einzelnen einheitlichen Block vertikal ausgerichteten Textes aus.

7

Gehe von einem einzelnen einheitlichen Textblock aus.

8

Behandle das Bild als einzelne Textzeile.

9

Behandle das Bild als einzelnes Wort.

10

Behandle das Bild als einzelnes Wort in einem Kreis.

11

Behandle das Bild als einzelnes Zeichen.

12

Sparsamer Text. Finde so viel Text wie möglich in keiner bestimmten Reihenfolge.

13

Sparsamer Text mit OSD.

14

Rohzeile. Behandle das Bild als einzelne Textzeile und umgehe Tesseract-spezifische Hacks.