Wstępne przetwarzanie

Wstępne przetwarzanie (lub przetwarzanie obrazu) przygotowuje przechwycony obraz ekranu przed wysłaniem go do silnika OCR w celu rozpoznania tekstu.

Ważne: Wstępne przetwarzanie jest głównie przydatne dla tradycyjnych silników OCR (Tesseract OCR i Windows OCR). Jeśli używasz nowoczesnych silników OCR takich jak Fast OCR lub silników opartych na SI (Google Cloud Vision, Azure Cloud Vision, silniki oparte na LLM), możesz pominąć wstępne przetwarzanie, ponieważ te silniki automatycznie radzą sobie z różnymi warunkami obrazu.

Kiedy używać wstępnego przetwarzania

Użyj wstępnego przetwarzania gdy:

  • Używasz Tesseract OCR lub Windows OCR

  • Tekst gry ma kolorowe lub złożone tło

  • Kontrast między tekstem a tłem jest niski

  • Dokładność OCR jest słaba bez korekt

Pomiń wstępne przetwarzanie gdy:

  • Używasz Fast OCR, EasyOCR, lub inne nowoczesne silniki

  • Używasz silników opartych na SI (Qwen 2.5 VL, GPT-4 Vision, Claude Vision)

  • Używasz silniki w chmurze (Google Cloud Vision, Azure Cloud Vision)


Opcje wstępnego przetwarzania

Skalowanie obrazu (OCR Master)

Zwiększa rozdzielczość lub rozmiar przechwyconego obrazu. Wyższa rozdzielczość może pomóc silnikowi OCR dokładniej rozpoznawać mały lub rozmyty tekst.

Filtr obrazu (OCR Master)

Usuwa kolory tła i poprawia widoczność tekstu. Dostępne są trzy opcje filtrowania:

  • Filtr czarnego tekstu

    • Konwertuje obraz tak, aby tekst był czarny na białym tle

  • Filtr białego tekstu

    • Konwertuje obraz tak, aby tekst był biały na czarnym tle

  • Filtr kolorowego tekstu

    • Zachowuje kolory tekstu przy jednoczesnym usunięciu tła

Regulacje obrazu

Dopasuj przechwycony obraz, aby poprawić rozpoznawanie tekstu:

  • Skala szarości

    • Konwertuje obraz na czarno-biały (usuwa wszystkie kolory)

  • Normalizuj

    • Automatycznie dostosowuje jasność i kontrast obrazu

    • Dostosuj wartość progową, aby tekst był bardziej wyraźny

  • Negatyw

    • Zamienia kolory czerni i bieli na obrazie

  • Próg

    • Kontroluje kontrast między tekstem a tłem

    • Dostosuj wartość progową, aby tekst był bardziej wyraźny

  • Jasność ogólna

    • Dostosowuje ogólną jasność obrazu

  • Jasność

    • Dostosowuje, jak jasno lub ciemno obraz się prezentuje

  • Wyostrz

    • Sprawia, że krawędzie tekstu są bardziej zdefiniowane i wyraźne