Tesseract OCR
Stáhnout a nainstalovat Tesseract
Navštivte Tesseract na UB Mannheim
Vyberte tesseract-ocr-w64-setup-v5.3.x.exe (64 bit) soubor pro stažení spustitelného instalátoru Tesseractu
Po stažení otevřete spustitelný soubor a řiďte se pokyny instalátoru
Ujistěte se, že jste nainstalovali tesseract-64bit do C:\Program Files\Tesseract-OCR
Trénovaná datová soubory (jazyky)
Můžete stáhnout .traineddata soubor pro požadovaný jazyk a umístit jej do instalačního adresáře Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[zde]
(to by mělo být stejné jako místo, kde je nainstalován adresář tessdata)
tessdata https://github.com/tesseract-ocr/tessdata Rychlost : Rychlejší než tessdata-best Přesnost : Mírně méně přesné než tessdata-best
tessdata-best
(Doporučeno pro videohry)https://github.com/tesseract-ocr/tessdata_best Rychlost : Nejpomalejší Přesnost : Nejpřesnější
tessdata-fast https://github.com/tesseract-ocr/tessdata_fast Rychlost : Nejsrychlejší Přesnost : Nejméně přesné
Režimy segmentace stránky
PSM vám umožňuje vybrat metodu segmentace v závislosti na konkrétním obrázku a prostředí, ve kterém byl pořízen
1
Pouze detekce orientace a písma (OSD).
2
Automatická segmentace stránky s OSD.
3
Automatická segmentace stránky, ale bez OSD nebo OCR. (není implementováno)
4
Plně automatická segmentace stránky, ale bez OSD. (Výchozí)
5
Předpokládejte jediný sloupec textu s proměnnými velikostmi.
6
Předpokládejte jediný jednotný blok vertikálně zarovnaného textu.
7
Předpokládejte jediný jednotný blok textu.
8
Zpracovávat obrázek jako jediný textový řádek.
9
Zpracovávat obrázek jako jediné slovo.
10
Zpracovávat obrázek jako jediné slovo v kruhu.
11
Zpracovávat obrázek jako jeden znak.
12
Řídce rozmístěný text. Najít co nejvíce textu bez zvláštního pořadí.
13
Řídce rozmístěný text s OSD.
14
Surový řádek. Zpracovávat obrázek jako jediný textový řádek a obejít úpravy specifické pro Tesseract.