Memahami OCR dan Meningkatkan Akurasi

Panduan ini menjelaskan bagaimana OCR bekerja di VNTranslator dan memberikan tips praktis untuk meningkatkan akurasi pengenalan teks.

Catatan: Panduan ini terutama berfokus pada mesin OCR tradisional (Tesseract OCR dan Windows OCR). Jika Anda menggunakan mesin OCR modern seperti Fast OCR, mesin berbasis LLM (Qwen 2.5 VL, GPT-4 Vision, Claude Vision), atau mesin berbasis cloud (Google Cloud Vision, Azure Cloud Vision), Anda dapat melewati sebagian besar penyesuaian pra-pemrosesan karena mesin-mesin ini menangani latar belakang kompleks dan teks berwarna secara otomatis.

Bagaimana OCR Bekerja di VNTranslator

1. Tangkap Layar

Langkah pertama dalam proses OCR adalah menangkap gambar dari layar. Kualitas gambar yang ditangkap sangat memengaruhi kemampuan mesin OCR untuk mengenali teks dengan akurat.

2. Pra-pemrosesan (Pemrosesan Gambar)

Hanya untuk Mesin OCR Tradisional.

Pra-pemrosesan terutama diperlukan saat menggunakan Tesseract OCR atau Windows OCR. Mesin OCR modern seperti Fast OCR, mesin berbasis LLM, dan mesin berbasis cloud dapat menangani berbagai kondisi teks tanpa penyesuaian pra-pemrosesan.

Selama pra-pemrosesan, gambar disesuaikan untuk menampilkan teks hitam pada latar putih. Kontras ini memudahkan mesin OCR tradisional untuk mengenali teks.

Kapan harus menggunakan pra-pemrosesan:

  • Menggunakan Tesseract OCR atau Windows OCR

  • Teks dalam game memiliki latar berwarna

  • Kontras rendah antara teks dan latar belakang

  • Perlu meningkatkan akurasi pengenalan untuk mesin tradisional

Kapan pra-pemrosesan TIDAK diperlukan:

  • Menggunakan Fast OCR atau mesin OCR modern

  • Menggunakan mesin berbasis LLM (Qwen 2.5 VL, GPT-4 Vision, Claude Vision)

  • Menggunakan mesin berbasis cloud (Google Cloud Vision, Azure Cloud Vision)

3. Memilih Mesin OCR

Akurasi pengenalan teks sangat bergantung pada mesin OCR yang Anda pilih. VNTranslator mendukung tiga kategori mesin OCR:

Mesin OCR Tradisional

  • Contoh: Tesseract OCR, Windows OCR

  • Terbaik untuk: Teks sederhana dengan teks hitam di atas latar putih

  • Keterbatasan: Mungkin kesulitan dengan teks berwarna atau latar belakang kompleks

  • Membutuhkan: Penyesuaian pra-pemrosesan untuk akurasi yang lebih baik

Mesin OCR Modern ⭐⭐⭐

  • Contoh: Fast OCR, EasyOCR

  • Terbaik untuk: Kebisingan latar moderat dan teks multicolor

  • Keunggulan: Penanganan kondisi teks yang lebih baik tanpa pra-pemrosesan

  • Membutuhkan: Sedikit atau tanpa pra-pemrosesan

Mesin OCR Berbasis AI ⭐⭐⭐⭐⭐

  • Contoh: Google Cloud Vision, Azure Cloud Vision, Qwen 2.5 VL, GPT-4 Vision, Claude Vision

  • Terbaik untuk: Latar belakang kompleks, teks miring, dan teks berwarna

  • Keunggulan: Akurasi tinggi tanpa pra-pemrosesan, menangani berbagai kondisi teks secara otomatis

  • Membutuhkan: Tidak perlu pra-pemrosesan

Untuk perbandingan lengkap mesin OCR, lihat Mesin OCR.

4. Pasca-pemrosesan

Setelah mesin OCR memproses teks, hasil akan ditampilkan. Jika pengenalan tidak akurat, Anda dapat melakukan koreksi selama pasca-pemrosesan menggunakan Regular Expressions (RegExp) untuk menyempurnakan hasil.

Pasca-pemrosesan berguna untuk semua jenis mesin OCR untuk:

  • Menghapus karakter yang tidak diinginkan

  • Memperbaiki kesalahan pengenalan umum

  • Memformat teks keluaran


Tips untuk Meningkatkan Akurasi OCR

Untuk Mesin OCR Tradisional (Tesseract, Windows OCR)

  1. Pastikan tangkapan gambar berkualitas tinggi: Semakin baik kualitas tangkapan layar, semakin tinggi akurasi OCR. Hindari gambar yang buram atau beresolusi rendah.

  2. Gunakan pra-pemrosesan yang efektif: Sesuaikan gambar agar memiliki kontras tinggi (teks hitam pada latar putih) untuk memudahkan pengenalan teks oleh mesin OCR.

  3. Pilih pengaturan ambang yang tepat: Coba berbagai nilai ambang pada opsi pra-pemrosesan untuk menemukan pengaturan terbaik untuk game Anda.

Untuk Mesin OCR Modern dan Berbasis AI

  1. Pastikan tangkapan gambar berkualitas tinggi: Kualitas tangkapan yang baik tetap membantu, tetapi mesin-mesin ini lebih toleran terhadap kualitas gambar.

  2. Lewati pra-pemrosesan: Mesin OCR modern dan berbasis AI bekerja paling baik dengan gambar asli tanpa penyesuaian pra-pemrosesan.

  3. Pilih mesin yang tepat untuk kebutuhan Anda:

    • Gunakan Fast OCR untuk pengenalan cepat secara offline dengan akurasi sedang

    • Gunakan mesin berbasis cloud untuk akurasi tertinggi dengan teks kompleks

    • Gunakan mesin berbasis LLM untuk fleksibilitas dan akurasi maksimal

Untuk Semua Jenis Mesin OCR

  1. Manfaatkan pasca-pemrosesan: Jika pengenalan teks salah atau Anda ingin menghapus karakter tertentu, gunakan RegExp selama pasca-pemrosesan untuk menyempurnakan keluaran.

  2. Posisikan area tangkapan dengan benar: Pastikan area tangkapan hanya mencakup kotak dialog teks untuk menghindari menangkap elemen yang tidak perlu.

  3. Uji berbagai mesin: Coba berbagai mesin OCR untuk menemukan mana yang paling cocok untuk game atau novel visual spesifik Anda.