Tesseract OCR

Pobierz i zainstaluj Tesseract

  • Wybierz tesseract-ocr-w64-setup-v5.3.x.exe (64-bit)) plik, aby pobrać wykonywalny instalator Tesseract

  • Po pobraniu otwórz plik wykonywalny i postępuj zgodnie z poleceniami instalatora

circle-info

Upewnij się, że zainstalowałeś tesseract-64bit w C:\Program Files\Tesseract-OCR

Pliki z danymi wytrenowanymi (języki)

Możesz pobrać .traineddata plik dla potrzebnego języka i umieścić go w katalogu instalacyjnym Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[tutaj] (to powinno być to samo miejsce, w którym zainstalowano katalog tessdata)

tessdata https://github.com/tesseract-ocr/tessdataarrow-up-right Szybkość: Szybszy niż tessdata-best Dokładność: Nieco mniej dokładny niż tessdata-best

tessdata-best (Zalecane dla gier wideo) https://github.com/tesseract-ocr/tessdata_bestarrow-up-right Szybkość: Najwolniejszy Dokładność: Najdokładniejszy

tessdata-fast https://github.com/tesseract-ocr/tessdata_fastarrow-up-right Szybkość: Najszybszy Dokładność: Najmniej dokładny

Tryby segmentacji stron

PSM pozwala wybrać metodę segmentacji zależną od konkretnego obrazu i środowiska, w którym został wykonany

Tryby segmentacji strony

1

Tylko wykrywanie orientacji i pisma (OSD).

2

Automatyczna segmentacja strony z OSD.

3

Automatyczna segmentacja strony, ale bez OSD i OCR. (niezaimplementowane)

4

W pełni automatyczna segmentacja strony, ale bez OSD. (Domyślny)

5

Załóż pojedynczą kolumnę tekstu o zmiennych rozmiarach.

6

Załóż pojedynczy jednorodny blok pionowo wyrównanego tekstu.

7

Załóż pojedynczy jednorodny blok tekstu.

8

Traktuj obraz jako pojedynczą linię tekstu.

9

Traktuj obraz jako pojedyncze słowo.

10

Traktuj obraz jako pojedyncze słowo w kole.

11

Traktuj obraz jako pojedynczy znak.

12

Rzadki tekst. Znajdź jak najwięcej tekstu bez określonego porządku.

13

Rzadki tekst z OSD.

14

Surowa linia. Traktuj obraz jako pojedynczą linię tekstu, pomijając sztuczki specyficzne dla Tesseracta.