OCR verstehen und Genauigkeit verbessern

Dieser Leitfaden erklärt, wie OCR in VNTranslator funktioniert und gibt praktische Tipps zur Verbesserung der Texterkennungsgenauigkeit.

Hinweis: Dieser Leitfaden konzentriert sich hauptsächlich auf traditionelle OCR-Engines (Tesseract OCR und Windows OCR). Wenn Sie moderne OCR-Engines wie Fast OCR, LLM-basierte Engines (Qwen 2.5 VL, GPT-4 Vision, Claude Vision) oder cloud-basierte Engines (Google Cloud Vision, Azure Cloud Vision) verwenden, können Sie die meisten Vorverarbeitungsanpassungen überspringen, da diese Engines komplexe Hintergründe und farbigen Text automatisch verarbeiten.

Wie OCR in VNTranslator funktioniert

1. Bildschirmaufnahme

Der erste Schritt im OCR-Prozess ist das Erfassen eines Bildes vom Bildschirm. Die Qualität des aufgenommenen Bildes beeinflusst stark die Fähigkeit der OCR-Engine, Text genau zu erkennen.

2. Vorverarbeitung (Bildverarbeitung)

Nur für traditionelle OCR-Engines.
Vorverarbeitung ist hauptsächlich erforderlich, wenn Sie Tesseract OCR oder Windows OCR. Moderne OCR-Engines wie Fast OCR, LLM-basierte Engines, und cloudbasierte Engines können verschiedene Textbedingungen ohne Vorverarbeitungsanpassungen verarbeiten.

Während der Vorverarbeitung wird das Bild so angepasst, dass schwarzer Text auf weißem Hintergrund angezeigt wird. Dieser Kontrast erleichtert es traditionellen OCR-Engines, den Text zu erkennen.

Wann Vorverarbeitung verwendet werden sollte:

Verwendung von Tesseract OCR oder Windows OCR
Spieltext hat farbige Hintergründe
Geringer Kontrast zwischen Text und Hintergrund
Müssen die Erkennungsgenauigkeit für traditionelle Engines verbessern

Wann Vorverarbeitung NICHT erforderlich ist:

Verwendung von Fast OCR oder modernen OCR-Engines
Verwendung von LLM-basierten Engines (Qwen 2.5 VL, GPT-4 Vision, Claude Vision)
Verwendung von cloud-basierten Engines (Google Cloud Vision, Azure Cloud Vision)

3. Auswahl der OCR-Engine

Die Genauigkeit der Texterkennung hängt stark von der gewählten OCR-Engine ab. VNTranslator unterstützt drei Kategorien von OCR-Engines:

Traditionelle OCR-Engines ⭐

Beispiele: Tesseract OCR, Windows OCR
Am besten geeignet für: Einfachen Text mit schwarzem Text auf weißem Hintergrund
Einschränkungen: Kann bei farbigem Text oder komplexen Hintergründen Probleme haben
Erfordert: Vorverarbeitungsanpassungen für bessere Genauigkeit

Moderne OCR-Engines ⭐⭐⭐

Beispiele: Fast OCR, EasyOCR
Am besten geeignet für: Moderates Hintergrundrauschen und mehrfarbiger Text
Vorteile: Bessere Verarbeitung verschiedener Textbedingungen ohne Vorverarbeitung
Erfordert: Wenig bis keine Vorverarbeitung

KI-basierte OCR-Engines ⭐⭐⭐⭐⭐

Beispiele: Google Cloud Vision, Azure Cloud Vision, Qwen 2.5 VL, GPT-4 Vision, Claude Vision
Am besten geeignet für: Komplexe Hintergründe, gedrehter Text und farbiger Text
Vorteile: Hohe Genauigkeit ohne Vorverarbeitung, verarbeitet verschiedene Textbedingungen automatisch
Erfordert: Keine Vorverarbeitung erforderlich

Für einen vollständigen Vergleich der OCR-Engines siehe OCR-Engines.

4. Nachbearbeitung

Nachdem die OCR-Engine den Text verarbeitet hat, wird das Ergebnis angezeigt. Wenn die Erkennung ungenau ist, können Sie während der Nachbearbeitung mit regulären Ausdrücken (RegExp) Korrekturen vornehmen, um die Ergebnisse zu verfeinern.

Nachbearbeitung ist für alle OCR-Engine-Typen nützlich, um:

Unerwünschte Zeichen entfernen
Häufige Erkennungsfehler beheben
Den Ausgabe-Text formatieren

Tipps zur Verbesserung der OCR-Genauigkeit

Für traditionelle OCR-Engines (Tesseract, Windows OCR)

Sorgen Sie für hochwertige Bildaufnahmen: Je besser die Qualität der Bildschirmaufnahme, desto höher die Genauigkeit der OCR. Vermeiden Sie verschwommene oder niedrig aufgelöste Bilder.
Verwenden Sie effektive Vorverarbeitung: Passen Sie das Bild so an, dass hoher Kontrast (schwarzer Text auf weißem Hintergrund) vorhanden ist, um der OCR-Engine die Texterkennung zu erleichtern.
Wählen Sie geeignete Schwellenwerteinstellungen: Experimentieren Sie mit Schwellenwerten in den Vorverarbeitungsoptionen, um die beste Einstellung für Ihr Spiel zu finden.

Für moderne und KI-basierte OCR-Engines

Sorgen Sie für hochwertige Bildaufnahmen: Gute Aufnahmequalität hilft weiterhin, aber diese Engines sind bei der Bildqualität nachsichtiger.
Vorverarbeitung überspringen: Moderne und KI-basierte OCR-Engines funktionieren am besten mit dem Originalbild ohne Vorverarbeitungsanpassungen.
Wählen Sie die richtige Engine für Ihre Bedürfnisse:
- Verwenden Sie Fast OCR für offline, schnelle Erkennung mit moderater Genauigkeit
- Verwenden Sie cloudbasierte Engines für höchste Genauigkeit bei komplexem Text
- Verwenden Sie LLM-basierte Engines für maximale Flexibilität und Genauigkeit

Für alle OCR-Engine-Typen

Nutzen Sie die Nachbearbeitung: Wenn die Texterkennung falsch ist oder Sie bestimmte Zeichen entfernen möchten, verwenden Sie RegExp während der Nachbearbeitung, um die Ausgabe zu verfeinern.
Positionieren Sie den Aufnahmebereich korrekt: Stellen Sie sicher, dass der Aufnahmebereich nur das Textdialogfeld abdeckt, um das Erfassen unnötiger Elemente zu vermeiden.
Testen Sie verschiedene Engines: Probieren Sie verschiedene OCR-Engines aus, um herauszufinden, welche am besten für Ihr spezifisches Spiel oder Ihre Visual Novel funktioniert.

VorherigeNachbearbeitung NächsteAutoTrans

hashtagWie OCR in VNTranslator funktioniert

hashtag1. Bildschirmaufnahme

hashtag2. Vorverarbeitung (Bildverarbeitung)

hashtag3. Auswahl der OCR-Engine

hashtag4. Nachbearbeitung