Tesseract OCR

Stáhnout a nainstalovat Tesseract

  • Vyberte tesseract-ocr-w64-setup-v5.3.x.exe (64 bit) soubor pro stažení spustitelného instalátoru Tesseractu

  • Po stažení otevřete spustitelný soubor a řiďte se pokyny instalátoru

circle-info

Ujistěte se, že jste nainstalovali tesseract-64bit do C:\Program Files\Tesseract-OCR

Trénovaná datová soubory (jazyky)

Můžete stáhnout .traineddata soubor pro požadovaný jazyk a umístit jej do instalačního adresáře Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[zde] (to by mělo být stejné jako místo, kde je nainstalován adresář tessdata)

tessdata https://github.com/tesseract-ocr/tessdataarrow-up-right Rychlost : Rychlejší než tessdata-best Přesnost : Mírně méně přesné než tessdata-best

tessdata-best (Doporučeno pro videohry) https://github.com/tesseract-ocr/tessdata_bestarrow-up-right Rychlost : Nejpomalejší Přesnost : Nejpřesnější

tessdata-fast https://github.com/tesseract-ocr/tessdata_fastarrow-up-right Rychlost : Nejsrychlejší Přesnost : Nejméně přesné

Režimy segmentace stránky

PSM vám umožňuje vybrat metodu segmentace v závislosti na konkrétním obrázku a prostředí, ve kterém byl pořízen

Režimy segmentace stránky

1

Pouze detekce orientace a písma (OSD).

2

Automatická segmentace stránky s OSD.

3

Automatická segmentace stránky, ale bez OSD nebo OCR. (není implementováno)

4

Plně automatická segmentace stránky, ale bez OSD. (Výchozí)

5

Předpokládejte jediný sloupec textu s proměnnými velikostmi.

6

Předpokládejte jediný jednotný blok vertikálně zarovnaného textu.

7

Předpokládejte jediný jednotný blok textu.

8

Zpracovávat obrázek jako jediný textový řádek.

9

Zpracovávat obrázek jako jediné slovo.

10

Zpracovávat obrázek jako jediné slovo v kruhu.

11

Zpracovávat obrázek jako jeden znak.

12

Řídce rozmístěný text. Najít co nejvíce textu bez zvláštního pořadí.

13

Řídce rozmístěný text s OSD.

14

Surový řádek. Zpracovávat obrázek jako jediný textový řádek a obejít úpravy specifické pro Tesseract.