OCR'ü Anlama ve Doğruluğu Artırma

Bu kılavuz, VNTranslator'da OCR'in nasıl çalıştığını açıklar ve metin tanıma doğruluğunu artırmak için pratik ipuçları sağlar.

Not: Bu kılavuz öncelikle geleneksel OCR motorlarına (Tesseract OCR ve Windows OCR) odaklanır. Fast OCR, LLM tabanlı motorlar (Qwen 2.5 VL, GPT-4 Vision, Claude Vision) veya bulut tabanlı motorlar (Google Cloud Vision, Azure Cloud Vision) gibi modern OCR motorlarını kullanıyorsanız, bu motorlar karmaşık arka planları ve renkli metinleri otomatik olarak işledikleri için çoğu ön işleme ayarını atlayabilirsiniz.

VNTranslator'da OCR Nasıl Çalışır

1. Ekran Yakalama

OCR sürecinin ilk adımı ekrandan bir görüntü yakalamaktır. Yakalanan görüntünün kalitesi, OCR motorunun metni doğru tanıma yeteneğini önemli ölçüde etkiler.

2. Ön İşleme (Görüntü İşleme)

Sadece Geleneksel OCR Motorları için.

Ön işleme esas olarak şununla kullanıldığında gereklidir Tesseract OCR veya Windows OCR. Modern OCR motorları gibi Fast OCR, LLM tabanlı motorlar, ve bulut tabanlı motorlar ön işleme ayarları olmadan çeşitli metin koşullarını işleyebilir.

Ön işleme sırasında görüntü, siyah metnin beyaz arka planda görünmesi için ayarlanır. Bu kontrast, geleneksel OCR motorlarının metni tanımasını kolaylaştırır.

Ne zaman ön işlem kullanılmalı:

  • Tesseract OCR veya Windows OCR kullanılıyorsa

  • Oyun metninin renkli arka planları varsa

  • Metin ile arka plan arasında düşük kontrast varsa

  • Geleneksel motorlar için tanıma doğruluğunu artırmanız gerekiyorsa

Ne zaman ön işleme GEREK YOK:

  • Fast OCR veya modern OCR motorları kullanıldığında

  • LLM tabanlı motorlar kullanıldığında (Qwen 2.5 VL, GPT-4 Vision, Claude Vision)

  • Bulut tabanlı motorlar kullanıldığında (Google Cloud Vision, Azure Cloud Vision)

3. OCR Motorunu Seçme

Metin tanıma doğruluğu büyük ölçüde seçtiğiniz OCR motoruna bağlıdır. VNTranslator üç kategori OCR motorunu destekler:

Geleneksel OCR Motorları

  • Örnekler: Tesseract OCR, Windows OCR

  • En uygun için: Beyaz arka planda siyah metin gibi basit metinler

  • Sınırlamalar: Renkli metinler veya karmaşık arka planlarla zorlanabilir

  • Gerektirir: Daha iyi doğruluk için ön işleme ayarları

Modern OCR Motorları ⭐⭐⭐

  • Örnekler: Fast OCR, EasyOCR

  • En uygun için: Orta düzey arka plan gürültüsü ve çok renkli metin

  • Avantajlar: Ön işleme olmadan çeşitli metin koşullarını daha iyi idare eder

  • Gerektirir: Az veya hiç ön işleme gerektirmez

AI tabanlı OCR Motorları ⭐⭐⭐⭐⭐

  • Örnekler: Google Cloud Vision, Azure Cloud Vision, Qwen 2.5 VL, GPT-4 Vision, Claude Vision

  • En uygun için: Karmaşık arka planlar, döndürülmüş metin ve renkli metin

  • Avantajlar: Ön işleme olmadan yüksek doğruluk, çeşitli metin koşullarını otomatik olarak işler

  • Gerektirir: Ön işleme gerekmez

OCR motorlarının tam karşılaştırması için bkz OCR Motorları.

4. Son İşleme

OCR motoru metni işledikten sonra sonuç görüntülenecektir. Tanıma doğru değilse, sonuçları iyileştirmek için Son İşleme sırasında Düzenli İfadeler (RegExp) kullanarak düzeltmeler yapabilirsiniz.

Son işleme, tüm OCR motoru türleri için faydalıdır:

  • İstenmeyen karakterleri kaldırmak

  • Yaygın tanıma hatalarını düzeltmek

  • Çıktı metnini biçimlendirmek


OCR Doğruluğunu Artırmak İçin İpuçları

Geleneksel OCR Motorları için (Tesseract, Windows OCR)

  1. Yüksek kaliteli görüntü yakalamalarını sağlayın: Ekran yakalamanın kalitesi ne kadar iyi olursa OCR doğruluğu da o kadar yüksek olur. Bulanık veya düşük çözünürlüklü görüntülerden kaçının.

  2. Etkili ön işleme kullanın: Görüntüyü yüksek kontrastlı (beyaz arka planda siyah metin) hale getirmek, OCR motorunun metni tanımasını kolaylaştırır.

  3. Uygun eşik ayarlarını seçin: Oyununuz için en iyi ayarı bulmak amacıyla ön işleme seçeneklerindeki eşik değerleriyle denemeler yapın.

Modern ve AI tabanlı OCR Motorları için

  1. Yüksek kaliteli görüntü yakalamalarını sağlayın: İyi yakalama kalitesi yine de yardımcı olur, ancak bu motorlar görüntü kalitesi konusunda daha toleranslıdır.

  2. Ön işlemi atlayın: Modern ve AI tabanlı OCR motorları, ön işleme ayarları olmadan orijinal görüntü ile en iyi şekilde çalışır.

  3. İhtiyacınıza göre doğru motoru seçin:

    • Kullanmak için Fast OCR çevrimdışı, hızlı tanıma için orta düzey doğruluk

    • Kullanmak için bulut tabanlı motorlar karmaşık metinlerde en yüksek doğruluk için

    • Kullanmak için LLM tabanlı motorlar azami esneklik ve doğruluk için

Tüm OCR Motoru Türleri İçin

  1. Son işlemeyi kullanın: Metin tanıma yanlışsa veya belirli karakterleri kaldırmak istiyorsanız, çıktıyı iyileştirmek için son işlem sırasında RegExp kullanın.

  2. Yakalama alanını doğru konumlandırın: Yakalama alanının gereksiz öğeleri yakalamamak için yalnızca metin diyalog kutusunu kapsadığından emin olun.

  3. Farklı motorları test edin: Belirli oyununuz veya görsel romanınız için en iyi çalışanı bulmak amacıyla farklı OCR motorlarını deneyin.