فهم التعرف الضوئي على الحروف وتحسين الدقة
يشرح هذا الدليل كيفية عمل OCR في VNTranslator ويقدم نصائح عملية لتحسين دقة التعرف على النص.
ملاحظة: يركز هذا الدليل بشكل أساسي على محركات OCR التقليدية (Tesseract OCR و Windows OCR). إذا كنت تستخدم محركات OCR حديثة مثل Fast OCR، أو محركات تعتمد على LLM (Qwen 2.5 VL، GPT-4 Vision، Claude Vision)، أو محركات سحابية (Google Cloud Vision، Azure Cloud Vision)، فيمكنك تخطي معظم تعديلات المعالجة المسبقة لأن هذه المحركات تتعامل تلقائيًا مع الخلفيات المعقدة والنص الملون.
كيف يعمل OCR في VNTranslator
1. التقاط الشاشة

الخطوة الأولى في عملية OCR هي التقاط صورة من الشاشة. جودة الصورة الملتقطة تؤثر بشكل كبير على قدرة محرك OCR على التعرف على النص بدقة.
2. المعالجة المسبقة (معالجة الصورة)
فقط لمحركات OCR التقليدية.
تكون المعالجة المسبقة مطلوبة بشكل أساسي عند استخدام Tesseract OCR أو Windows OCR. المحركات الحديثة مثل Fast OCR, محركات تعتمد على LLM, و محركات سحابية يمكنها التعامل مع ظروف نصية مختلفة دون تعديلات المعالجة المسبقة.

أثناء المعالجة المسبقة، يتم تعديل الصورة لتظهر النص باللون الأسود على خلفية بيضاء. هذا التباين يسهل على محركات OCR التقليدية التعرف على النص.
متى يجب استخدام المعالجة المسبقة:
استخدام Tesseract OCR أو Windows OCR
نص اللعبة له خلفيات ملونة
تباين منخفض بين النص والخلفية
الحاجة إلى تحسين دقة التعرف لمحركات تقليدية
متى لا تكون المعالجة المسبقة ضرورية:
استخدام Fast OCR أو المحركات الحديثة لـ OCR
استخدام محركات تعتمد على LLM (Qwen 2.5 VL، GPT-4 Vision، Claude Vision)
استخدام محركات سحابية (Google Cloud Vision، Azure Cloud Vision)
3. اختيار محرك OCR
تعتمد دقة التعرف على النص بشكل كبير على محرك OCR الذي تختاره. يدعم VNTranslator ثلاث فئات من محركات OCR:
محركات OCR التقليدية ⭐
أمثلة: Tesseract OCR، Windows OCR
الأفضل من أجل: النص البسيط مع نص أسود على خلفية بيضاء
القيود: قد تواجه صعوبة مع النص الملون أو الخلفيات المعقدة
يتطلب: تعديلات المعالجة المسبقة للحصول على دقة أفضل
محركات OCR الحديثة ⭐⭐⭐
أمثلة: Fast OCR، EasyOCR
الأفضل من أجل: ضوضاء خلفية معتدلة ونص متعدد الألوان
المزايا: تعامل أفضل مع ظروف نصية متنوعة دون معالجة مسبقة
يتطلب: قليل إلى لا معالجة مسبقة
محركات OCR المعتمدة على الذكاء الاصطناعي ⭐⭐⭐⭐⭐
أمثلة: Google Cloud Vision، Azure Cloud Vision، Qwen 2.5 VL، GPT-4 Vision، Claude Vision
الأفضل من أجل: خلفيات معقدة، نص مائل، ونص ملون
المزايا: دقة عالية دون معالجة مسبقة، ويتعامل تلقائيًا مع ظروف نصية متنوعة
يتطلب: لا حاجة للمعالجة المسبقة
للمقارنة الكاملة بين محركات OCR، راجع محركات OCR.
4. المعالجة اللاحقة
بعد أن يعالج محرك OCR النص، سيتم عرض النتيجة. إذا كان التعرف غير دقيق، يمكنك إجراء تصحيحات أثناء المعالجة اللاحقة باستخدام التعبيرات النمطية (RegExp) لتحسين النتائج.
المعالجة اللاحقة مفيدة لجميع أنواع محركات OCR من أجل:
إزالة الأحرف غير المرغوب فيها
إصلاح أخطاء التعرف الشائعة
تنسيق نص الإخراج
نصائح لتحسين دقة OCR
بالنسبة لمحركات OCR التقليدية (Tesseract، Windows OCR)
ضمان لقطات عالية الجودة للصورة: كلما كانت جودة لقطة الشاشة أفضل، زادت دقة OCR. تجنب الصور الضبابية أو منخفضة الدقة.
استخدم معالجة مسبقة فعالة: قم بتعديل الصورة للحصول على تباين عالٍ (نص أسود على خلفية بيضاء) لتسهيل التعرف على النص لمحرك OCR.
اختر إعدادات العتبة المناسبة: جرّب قيم العتبة في خيارات المعالجة المسبقة للعثور على الإعداد الأفضل للعبتك.
بالنسبة لمحركات OCR الحديثة والمعتمدة على الذكاء الاصطناعي
ضمان لقطات عالية الجودة للصورة: لا تزال جودة الالتقاط الجيدة مفيدة، لكن هذه المحركات أكثر تساهلاً مع جودة الصورة.
تجاوز المعالجة المسبقة: تعمل محركات OCR الحديثة والمعتمدة على الذكاء الاصطناعي بشكل أفضل مع الصورة الأصلية دون تعديلات المعالجة المسبقة.
اختر المحرك المناسب لاحتياجاتك:
استخدم Fast OCR للتعرف السريع دون اتصال بدقة متوسطة
استخدم محركات سحابية للحصول على أعلى دقة مع النصوص المعقدة
استخدم محركات تعتمد على LLM للحصول على أقصى قدر من المرونة والدقة
لكل أنواع محركات OCR
استخدم المعالجة اللاحقة: إذا كان التعرف على النص غير صحيح أو أردت إزالة أحرف معينة، استخدم RegExp أثناء المعالجة اللاحقة لتحسين الإخراج.
ضع منطقة الالتقاط بشكل صحيح: تأكد من أن منطقة الالتقاط تغطي مربع حوار النص فقط لتجنب التقاط عناصر غير ضرورية.
اختبر محركات مختلفة: جرّب محركات OCR المختلفة لمعرفة أيها يعمل بشكل أفضل للعبة أو الرواية البصرية الخاصة بك.