前処理

前処理(または画像処理)は、キャプチャした画面画像をOCRエンジンに送って文字認識を行う前に準備する工程です。

重要: 前処理が主に役立つのは 従来型のOCRエンジン (Tesseract OCRやWindows OCR)。もしあなたが 最新のOCRエンジン (Fast OCRのような)を使用している場合や AIベースのエンジン (Google Cloud Vision、Azure Cloud Vision、LLMベースのエンジンなど)を使用している場合、これらのエンジンはさまざまな画像状態を自動で処理するため、前処理を省略できます。

前処理を使うべき場合

前処理を使用する際:

  • あなたが使用しているのは Tesseract OCR または Windows OCR

  • ゲームのテキストに色付きまたは複雑な背景がある

  • テキストと背景のコントラストが低い

  • 調整なしではOCRの精度が低い

前処理をスキップしてよい場合:

  • あなたが使用しているのは Fast OCR, EasyOCR、またはその他の最新のエンジン

  • あなたが使用しているのは AIベースのエンジン (Qwen 2.5 VL、GPT-4 Vision、Claude Vision)

  • あなたが使用しているのは クラウドベースのエンジン (Google Cloud Vision、Azure Cloud Vision)


前処理のオプション

画像アップスケーラー (OCR Master)

キャプチャした画像の解像度やサイズを上げます。高解像度は、小さかったりぼやけたテキストをOCRエンジンがより正確に認識するのに役立ちます。

画像フィルター (OCR Master)

背景色を除去しテキストの視認性を高めます。フィルターは3つのオプションがあります:

  • 黒文字フィルター

    • 画像を黒文字・白背景として表示するよう変換します

  • 白文字フィルター

    • 画像を白文字・黒背景として表示するよう変換します

  • カラー文字フィルター

    • 背景を除去しつつ文字の色を保持します

画像調整

より良い文字認識のためにキャプチャ画像を微調整します:

  • グレースケール

    • 画像を白黒に変換します(すべての色を除去)

  • 正規化

    • 画像の明るさとコントラストを自動で調整します

    • しきい値を調整して文字をより際立たせます

  • 反転

    • 画像の黒と白の色を入れ替えます

  • しきい値

    • テキストと背景のコントラストを制御します

    • しきい値を調整して文字をより際立たせます

  • 明度

    • 画像全体の明るさ(明度)を調整します

  • 輝度

    • 画像の明るさや暗さの見え方を調整します

  • シャープ

    • 文字のエッジをよりはっきりと鮮明にします