预处理

预处理(或图像处理)在将捕获的屏幕图像发送到 OCR 引擎进行文本识别之前对其进行准备。

重要: 预处理主要对以下情况有用 传统 OCR 引擎 (Tesseract OCR 和 Windows OCR)。如果你使用的是 现代 OCR 引擎 例如 Fast OCR 或 基于 AI 的引擎 (Google Cloud Vision、Azure Cloud Vision、基于大模型的引擎),你可以跳过预处理,因为这些引擎会自动处理各种图像状况。

何时使用预处理

在以下情况下使用预处理:

  • 你正在使用 Tesseract OCRWindows OCR

  • 游戏文本具有彩色或复杂的背景

  • 文本与背景之间对比度低

  • 在未调整的情况下 OCR 准确率很差

在以下情况下可跳过预处理:

  • 你正在使用 Fast OCR, EasyOCR,或其他现代引擎

  • 你正在使用 基于 AI 的引擎 (Qwen 2.5 VL、GPT-4 Vision、Claude Vision)

  • 你正在使用 基于云的引擎 (Google Cloud Vision、Azure Cloud Vision)


预处理选项

图像放大器 (OCR Master)

增加捕获图像的分辨率或大小。更高的分辨率可以帮助 OCR 引擎更准确地识别小字体或模糊文本。

图像滤镜 (OCR Master)

去除背景颜色并增强文本可见性。有三种滤镜选项:

  • 黑色文本滤镜

    • 将图像转换为黑字白底的显示方式

  • 白色文本滤镜

    • 将图像转换为白字黑底的显示方式

  • 彩色文本滤镜

    • 保留文本颜色同时去除背景

图像调整

微调捕获的图像以提高文本识别:

  • 灰度

    • 将图像转换为黑白(去除所有颜色)

  • 归一化

    • 自动调整图像亮度和对比度

    • 调整阈值以使文本更清晰突出

  • 反转

    • 交换图像中的黑白颜色

  • 阈值

    • 控制文本与背景之间的对比度

    • 调整阈值以使文本更清晰突出

  • 明度

    • 调整图像的整体明亮度

  • 亮度

    • 调整图像看起来的明暗程度

  • 锐化

    • 使文本边缘更清晰、轮廓更分明