Comprendre l'OCR et améliorer la précision

Ce guide explique comment fonctionne l'OCR dans VNTranslator et donne des conseils pratiques pour améliorer la précision de la reconnaissance de texte.

Remarque : Ce guide se concentre principalement sur les moteurs OCR traditionnels (Tesseract OCR et Windows OCR). Si vous utilisez des moteurs OCR modernes comme Fast OCR, des moteurs basés sur des LLM (Qwen 2.5 VL, GPT-4 Vision, Claude Vision) ou des moteurs cloud (Google Cloud Vision, Azure Cloud Vision), vous pouvez ignorer la plupart des ajustements de prétraitement car ces moteurs gèrent automatiquement les arrière-plans complexes et le texte en couleur.

Comment l'OCR fonctionne dans VNTranslator

1. Capture d'écran

La première étape du processus OCR consiste à capturer une image de l'écran. La qualité de l'image capturée influence fortement la capacité du moteur OCR à reconnaître le texte avec précision.

2. Prétraitement (traitement de l'image)

Pour les moteurs OCR traditionnels uniquement.

Le prétraitement est principalement nécessaire lors de l'utilisation de Tesseract OCR ou Windows OCR. Les moteurs OCR modernes comme Fast OCR, moteurs basés sur des LLM, et moteurs basés sur le cloud peuvent gérer diverses conditions de texte sans ajustements de prétraitement.

Pendant le prétraitement, l'image est ajustée pour afficher du texte noir sur un fond blanc. Ce contraste facilite la reconnaissance du texte par les moteurs OCR traditionnels.

Quand utiliser le prétraitement :

  • Utilisation de Tesseract OCR ou Windows OCR

  • Le texte du jeu a des arrière-plans colorés

  • Faible contraste entre le texte et l'arrière-plan

  • Besoin d'améliorer la précision de reconnaissance pour les moteurs traditionnels

Quand le prétraitement n'est PAS nécessaire :

  • Utilisation de Fast OCR ou de moteurs OCR modernes

  • Utilisation de moteurs basés sur des LLM (Qwen 2.5 VL, GPT-4 Vision, Claude Vision)

  • Utilisation de moteurs cloud (Google Cloud Vision, Azure Cloud Vision)

3. Sélection du moteur OCR

La précision de la reconnaissance de texte dépend fortement du moteur OCR que vous choisissez. VNTranslator prend en charge trois catégories de moteurs OCR :

Moteurs OCR traditionnels

  • Exemples : Tesseract OCR, Windows OCR

  • Idéal pour : Texte simple avec texte noir sur fond blanc

  • Limitations : Peut avoir des difficultés avec du texte coloré ou des arrière-plans complexes

  • Exige : Ajustements de prétraitement pour une meilleure précision

Moteurs OCR modernes ⭐⭐⭐

  • Exemples : Fast OCR, EasyOCR

  • Idéal pour : Bruit d'arrière-plan modéré et texte multicolore

  • Avantages : Meilleure gestion de diverses conditions de texte sans prétraitement

  • Exige : Prétraitement minimal ou inexistant

Moteurs OCR basés sur l'IA ⭐⭐⭐⭐⭐

  • Exemples : Google Cloud Vision, Azure Cloud Vision, Qwen 2.5 VL, GPT-4 Vision, Claude Vision

  • Idéal pour : Arrière-plans complexes, texte rotatif et texte coloré

  • Avantages : Haute précision sans prétraitement, gère automatiquement diverses conditions de texte

  • Exige : Aucun prétraitement nécessaire

Pour une comparaison complète des moteurs OCR, voir Moteurs OCR.

4. Post-traitement

Après que le moteur OCR a traité le texte, le résultat sera affiché. Si la reconnaissance est inexacte, vous pouvez effectuer des corrections lors du post-traitement en utilisant des expressions régulières (RegExp) pour affiner les résultats.

Le post-traitement est utile pour tous les types de moteurs OCR afin de :

  • Supprimer les caractères indésirables

  • Corriger les erreurs de reconnaissance courantes

  • Mettre en forme le texte de sortie


Conseils pour améliorer la précision de l'OCR

Pour les moteurs OCR traditionnels (Tesseract, Windows OCR)

  1. Assurer des captures d'image de haute qualité : Plus la qualité de la capture d'écran est bonne, plus la précision de l'OCR est élevée. Évitez les images floues ou de faible résolution.

  2. Utiliser un prétraitement efficace : Ajustez l'image pour qu'elle présente un fort contraste (texte noir sur fond blanc) afin de faciliter la reconnaissance du texte par le moteur OCR.

  3. Sélectionner des paramètres de seuil appropriés : Expérimentez avec les valeurs de seuil dans les options de prétraitement pour trouver le meilleur réglage pour votre jeu.

Pour les moteurs OCR modernes et basés sur l'IA

  1. Assurer des captures d'image de haute qualité : Une bonne qualité de capture aide toujours, mais ces moteurs sont plus tolérants quant à la qualité de l'image.

  2. Ignorer le prétraitement : Les moteurs OCR modernes et basés sur l'IA fonctionnent mieux avec l'image d'origine sans ajustements de prétraitement.

  3. Choisir le bon moteur selon vos besoins :

    • Utilisez Fast OCR pour une reconnaissance hors ligne, rapide et d'une précision modérée

    • Utilisez moteurs basés sur le cloud pour la plus haute précision avec du texte complexe

    • Utilisez moteurs basés sur des LLM pour une flexibilité et une précision maximales

Pour tous les types de moteurs OCR

  1. Utilisez le post-traitement : Si la reconnaissance du texte est incorrecte ou si vous souhaitez supprimer des caractères spécifiques, utilisez RegExp lors du post-traitement pour affiner la sortie.

  2. Positionnez correctement la zone de capture : Assurez-vous que la zone de capture ne couvre que la boîte de dialogue de texte afin d'éviter de capturer des éléments inutiles.

  3. Testez différents moteurs : Essayez différents moteurs OCR pour trouver celui qui fonctionne le mieux pour votre jeu ou votre visual novel spécifique.