Memahami OCR dan Meningkatkan Akurasi
Panduan ini menjelaskan bagaimana OCR bekerja di VNTranslator dan memberikan tips praktis untuk meningkatkan akurasi pengenalan teks.
Catatan: Panduan ini terutama berfokus pada mesin OCR tradisional (Tesseract OCR dan Windows OCR). Jika Anda menggunakan mesin OCR modern seperti Fast OCR, mesin berbasis LLM (Qwen 2.5 VL, GPT-4 Vision, Claude Vision), atau mesin berbasis cloud (Google Cloud Vision, Azure Cloud Vision), Anda dapat melewati sebagian besar penyesuaian pra-pemrosesan karena mesin-mesin ini menangani latar belakang kompleks dan teks berwarna secara otomatis.
Bagaimana OCR Bekerja di VNTranslator
1. Tangkap Layar

Langkah pertama dalam proses OCR adalah menangkap gambar dari layar. Kualitas gambar yang ditangkap sangat memengaruhi kemampuan mesin OCR untuk mengenali teks dengan akurat.
2. Pra-pemrosesan (Pemrosesan Gambar)
Hanya untuk Mesin OCR Tradisional.
Pra-pemrosesan terutama diperlukan saat menggunakan Tesseract OCR atau Windows OCR. Mesin OCR modern seperti Fast OCR, mesin berbasis LLM, dan mesin berbasis cloud dapat menangani berbagai kondisi teks tanpa penyesuaian pra-pemrosesan.

Selama pra-pemrosesan, gambar disesuaikan untuk menampilkan teks hitam pada latar putih. Kontras ini memudahkan mesin OCR tradisional untuk mengenali teks.
Kapan harus menggunakan pra-pemrosesan:
Menggunakan Tesseract OCR atau Windows OCR
Teks dalam game memiliki latar berwarna
Kontras rendah antara teks dan latar belakang
Perlu meningkatkan akurasi pengenalan untuk mesin tradisional
Kapan pra-pemrosesan TIDAK diperlukan:
Menggunakan Fast OCR atau mesin OCR modern
Menggunakan mesin berbasis LLM (Qwen 2.5 VL, GPT-4 Vision, Claude Vision)
Menggunakan mesin berbasis cloud (Google Cloud Vision, Azure Cloud Vision)
3. Memilih Mesin OCR
Akurasi pengenalan teks sangat bergantung pada mesin OCR yang Anda pilih. VNTranslator mendukung tiga kategori mesin OCR:
Mesin OCR Tradisional ⭐
Contoh: Tesseract OCR, Windows OCR
Terbaik untuk: Teks sederhana dengan teks hitam di atas latar putih
Keterbatasan: Mungkin kesulitan dengan teks berwarna atau latar belakang kompleks
Membutuhkan: Penyesuaian pra-pemrosesan untuk akurasi yang lebih baik
Mesin OCR Modern ⭐⭐⭐
Contoh: Fast OCR, EasyOCR
Terbaik untuk: Kebisingan latar moderat dan teks multicolor
Keunggulan: Penanganan kondisi teks yang lebih baik tanpa pra-pemrosesan
Membutuhkan: Sedikit atau tanpa pra-pemrosesan
Mesin OCR Berbasis AI ⭐⭐⭐⭐⭐
Contoh: Google Cloud Vision, Azure Cloud Vision, Qwen 2.5 VL, GPT-4 Vision, Claude Vision
Terbaik untuk: Latar belakang kompleks, teks miring, dan teks berwarna
Keunggulan: Akurasi tinggi tanpa pra-pemrosesan, menangani berbagai kondisi teks secara otomatis
Membutuhkan: Tidak perlu pra-pemrosesan
Untuk perbandingan lengkap mesin OCR, lihat Mesin OCR.
4. Pasca-pemrosesan
Setelah mesin OCR memproses teks, hasil akan ditampilkan. Jika pengenalan tidak akurat, Anda dapat melakukan koreksi selama pasca-pemrosesan menggunakan Regular Expressions (RegExp) untuk menyempurnakan hasil.
Pasca-pemrosesan berguna untuk semua jenis mesin OCR untuk:
Menghapus karakter yang tidak diinginkan
Memperbaiki kesalahan pengenalan umum
Memformat teks keluaran
Tips untuk Meningkatkan Akurasi OCR
Untuk Mesin OCR Tradisional (Tesseract, Windows OCR)
Pastikan tangkapan gambar berkualitas tinggi: Semakin baik kualitas tangkapan layar, semakin tinggi akurasi OCR. Hindari gambar yang buram atau beresolusi rendah.
Gunakan pra-pemrosesan yang efektif: Sesuaikan gambar agar memiliki kontras tinggi (teks hitam pada latar putih) untuk memudahkan pengenalan teks oleh mesin OCR.
Pilih pengaturan ambang yang tepat: Coba berbagai nilai ambang pada opsi pra-pemrosesan untuk menemukan pengaturan terbaik untuk game Anda.
Untuk Mesin OCR Modern dan Berbasis AI
Pastikan tangkapan gambar berkualitas tinggi: Kualitas tangkapan yang baik tetap membantu, tetapi mesin-mesin ini lebih toleran terhadap kualitas gambar.
Lewati pra-pemrosesan: Mesin OCR modern dan berbasis AI bekerja paling baik dengan gambar asli tanpa penyesuaian pra-pemrosesan.
Pilih mesin yang tepat untuk kebutuhan Anda:
Gunakan Fast OCR untuk pengenalan cepat secara offline dengan akurasi sedang
Gunakan mesin berbasis cloud untuk akurasi tertinggi dengan teks kompleks
Gunakan mesin berbasis LLM untuk fleksibilitas dan akurasi maksimal
Untuk Semua Jenis Mesin OCR
Manfaatkan pasca-pemrosesan: Jika pengenalan teks salah atau Anda ingin menghapus karakter tertentu, gunakan RegExp selama pasca-pemrosesan untuk menyempurnakan keluaran.
Posisikan area tangkapan dengan benar: Pastikan area tangkapan hanya mencakup kotak dialog teks untuk menghindari menangkap elemen yang tidak perlu.
Uji berbagai mesin: Coba berbagai mesin OCR untuk menemukan mana yang paling cocok untuk game atau novel visual spesifik Anda.