Tesseract OCR
Pobierz i zainstaluj Tesseract
Odwiedź Tesseract na UB Mannheim
Wybierz tesseract-ocr-w64-setup-v5.3.x.exe (64-bit)) plik, aby pobrać wykonywalny instalator Tesseract
Po pobraniu otwórz plik wykonywalny i postępuj zgodnie z poleceniami instalatora
Upewnij się, że zainstalowałeś tesseract-64bit w C:\Program Files\Tesseract-OCR
Pliki z danymi wytrenowanymi (języki)
Możesz pobrać .traineddata plik dla potrzebnego języka i umieścić go w katalogu instalacyjnym Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[tutaj]
(to powinno być to samo miejsce, w którym zainstalowano katalog tessdata)
tessdata https://github.com/tesseract-ocr/tessdata Szybkość: Szybszy niż tessdata-best Dokładność: Nieco mniej dokładny niż tessdata-best
tessdata-best
(Zalecane dla gier wideo)https://github.com/tesseract-ocr/tessdata_best Szybkość: Najwolniejszy Dokładność: Najdokładniejszy
tessdata-fast https://github.com/tesseract-ocr/tessdata_fast Szybkość: Najszybszy Dokładność: Najmniej dokładny
Tryby segmentacji stron
PSM pozwala wybrać metodę segmentacji zależną od konkretnego obrazu i środowiska, w którym został wykonany
1
Tylko wykrywanie orientacji i pisma (OSD).
2
Automatyczna segmentacja strony z OSD.
3
Automatyczna segmentacja strony, ale bez OSD i OCR. (niezaimplementowane)
4
W pełni automatyczna segmentacja strony, ale bez OSD. (Domyślny)
5
Załóż pojedynczą kolumnę tekstu o zmiennych rozmiarach.
6
Załóż pojedynczy jednorodny blok pionowo wyrównanego tekstu.
7
Załóż pojedynczy jednorodny blok tekstu.
8
Traktuj obraz jako pojedynczą linię tekstu.
9
Traktuj obraz jako pojedyncze słowo.
10
Traktuj obraz jako pojedyncze słowo w kole.
11
Traktuj obraz jako pojedynczy znak.
12
Rzadki tekst. Znajdź jak najwięcej tekstu bez określonego porządku.
13
Rzadki tekst z OSD.
14
Surowa linia. Traktuj obraz jako pojedynczą linię tekstu, pomijając sztuczki specyficzne dla Tesseracta.