Comprendre l'OCR et améliorer la précision
Ce guide explique comment fonctionne l'OCR dans VNTranslator et donne des conseils pratiques pour améliorer la précision de la reconnaissance de texte.
Remarque : Ce guide se concentre principalement sur les moteurs OCR traditionnels (Tesseract OCR et Windows OCR). Si vous utilisez des moteurs OCR modernes comme Fast OCR, des moteurs basés sur des LLM (Qwen 2.5 VL, GPT-4 Vision, Claude Vision) ou des moteurs cloud (Google Cloud Vision, Azure Cloud Vision), vous pouvez ignorer la plupart des ajustements de prétraitement car ces moteurs gèrent automatiquement les arrière-plans complexes et le texte en couleur.
Comment l'OCR fonctionne dans VNTranslator
1. Capture d'écran

La première étape du processus OCR consiste à capturer une image de l'écran. La qualité de l'image capturée influence fortement la capacité du moteur OCR à reconnaître le texte avec précision.
2. Prétraitement (traitement de l'image)
Pour les moteurs OCR traditionnels uniquement.
Le prétraitement est principalement nécessaire lors de l'utilisation de Tesseract OCR ou Windows OCR. Les moteurs OCR modernes comme Fast OCR, moteurs basés sur des LLM, et moteurs basés sur le cloud peuvent gérer diverses conditions de texte sans ajustements de prétraitement.

Pendant le prétraitement, l'image est ajustée pour afficher du texte noir sur un fond blanc. Ce contraste facilite la reconnaissance du texte par les moteurs OCR traditionnels.
Quand utiliser le prétraitement :
Utilisation de Tesseract OCR ou Windows OCR
Le texte du jeu a des arrière-plans colorés
Faible contraste entre le texte et l'arrière-plan
Besoin d'améliorer la précision de reconnaissance pour les moteurs traditionnels
Quand le prétraitement n'est PAS nécessaire :
Utilisation de Fast OCR ou de moteurs OCR modernes
Utilisation de moteurs basés sur des LLM (Qwen 2.5 VL, GPT-4 Vision, Claude Vision)
Utilisation de moteurs cloud (Google Cloud Vision, Azure Cloud Vision)
3. Sélection du moteur OCR
La précision de la reconnaissance de texte dépend fortement du moteur OCR que vous choisissez. VNTranslator prend en charge trois catégories de moteurs OCR :
Moteurs OCR traditionnels ⭐
Exemples : Tesseract OCR, Windows OCR
Idéal pour : Texte simple avec texte noir sur fond blanc
Limitations : Peut avoir des difficultés avec du texte coloré ou des arrière-plans complexes
Exige : Ajustements de prétraitement pour une meilleure précision
Moteurs OCR modernes ⭐⭐⭐
Exemples : Fast OCR, EasyOCR
Idéal pour : Bruit d'arrière-plan modéré et texte multicolore
Avantages : Meilleure gestion de diverses conditions de texte sans prétraitement
Exige : Prétraitement minimal ou inexistant
Moteurs OCR basés sur l'IA ⭐⭐⭐⭐⭐
Exemples : Google Cloud Vision, Azure Cloud Vision, Qwen 2.5 VL, GPT-4 Vision, Claude Vision
Idéal pour : Arrière-plans complexes, texte rotatif et texte coloré
Avantages : Haute précision sans prétraitement, gère automatiquement diverses conditions de texte
Exige : Aucun prétraitement nécessaire
Pour une comparaison complète des moteurs OCR, voir Moteurs OCR.
4. Post-traitement
Après que le moteur OCR a traité le texte, le résultat sera affiché. Si la reconnaissance est inexacte, vous pouvez effectuer des corrections lors du post-traitement en utilisant des expressions régulières (RegExp) pour affiner les résultats.
Le post-traitement est utile pour tous les types de moteurs OCR afin de :
Supprimer les caractères indésirables
Corriger les erreurs de reconnaissance courantes
Mettre en forme le texte de sortie
Conseils pour améliorer la précision de l'OCR
Pour les moteurs OCR traditionnels (Tesseract, Windows OCR)
Assurer des captures d'image de haute qualité : Plus la qualité de la capture d'écran est bonne, plus la précision de l'OCR est élevée. Évitez les images floues ou de faible résolution.
Utiliser un prétraitement efficace : Ajustez l'image pour qu'elle présente un fort contraste (texte noir sur fond blanc) afin de faciliter la reconnaissance du texte par le moteur OCR.
Sélectionner des paramètres de seuil appropriés : Expérimentez avec les valeurs de seuil dans les options de prétraitement pour trouver le meilleur réglage pour votre jeu.
Pour les moteurs OCR modernes et basés sur l'IA
Assurer des captures d'image de haute qualité : Une bonne qualité de capture aide toujours, mais ces moteurs sont plus tolérants quant à la qualité de l'image.
Ignorer le prétraitement : Les moteurs OCR modernes et basés sur l'IA fonctionnent mieux avec l'image d'origine sans ajustements de prétraitement.
Choisir le bon moteur selon vos besoins :
Utilisez Fast OCR pour une reconnaissance hors ligne, rapide et d'une précision modérée
Utilisez moteurs basés sur le cloud pour la plus haute précision avec du texte complexe
Utilisez moteurs basés sur des LLM pour une flexibilité et une précision maximales
Pour tous les types de moteurs OCR
Utilisez le post-traitement : Si la reconnaissance du texte est incorrecte ou si vous souhaitez supprimer des caractères spécifiques, utilisez RegExp lors du post-traitement pour affiner la sortie.
Positionnez correctement la zone de capture : Assurez-vous que la zone de capture ne couvre que la boîte de dialogue de texte afin d'éviter de capturer des éléments inutiles.
Testez différents moteurs : Essayez différents moteurs OCR pour trouver celui qui fonctionne le mieux pour votre jeu ou votre visual novel spécifique.