预处理
预处理(或图像处理)在将捕获的屏幕图像发送到 OCR 引擎进行文本识别之前对其进行准备。
重要: 预处理主要对以下情况有用 传统 OCR 引擎 (Tesseract OCR 和 Windows OCR)。如果你使用的是 现代 OCR 引擎 例如 Fast OCR 或 基于 AI 的引擎 (Google Cloud Vision、Azure Cloud Vision、基于大模型的引擎),你可以跳过预处理,因为这些引擎会自动处理各种图像状况。

何时使用预处理
在以下情况下使用预处理:
你正在使用 Tesseract OCR 或 Windows OCR
游戏文本具有彩色或复杂的背景
文本与背景之间对比度低
在未调整的情况下 OCR 准确率很差
在以下情况下可跳过预处理:
你正在使用 Fast OCR, EasyOCR,或其他现代引擎
你正在使用 基于 AI 的引擎 (Qwen 2.5 VL、GPT-4 Vision、Claude Vision)
你正在使用 基于云的引擎 (Google Cloud Vision、Azure Cloud Vision)
预处理选项
图像放大器 (OCR Master)
增加捕获图像的分辨率或大小。更高的分辨率可以帮助 OCR 引擎更准确地识别小字体或模糊文本。
图像滤镜 (OCR Master)
去除背景颜色并增强文本可见性。有三种滤镜选项:
黑色文本滤镜
将图像转换为黑字白底的显示方式
白色文本滤镜
将图像转换为白字黑底的显示方式
彩色文本滤镜
保留文本颜色同时去除背景



图像调整
微调捕获的图像以提高文本识别:
灰度
将图像转换为黑白(去除所有颜色)
归一化
自动调整图像亮度和对比度
调整阈值以使文本更清晰突出
反转
交换图像中的黑白颜色
阈值
控制文本与背景之间的对比度
调整阈值以使文本更清晰突出
明度
调整图像的整体明亮度
亮度
调整图像看起来的明暗程度
锐化
使文本边缘更清晰、轮廓更分明