Tesseract OCR

ดาวน์โหลดและติดตั้ง Tesseract

  • เลือก tesseract-ocr-w64-setup-v5.3.x.exe (64 บิต) ไฟล์เพื่อติดตั้งตัวติดตั้งแบบใช้งานได้ของ Tesseract

  • เมื่อดาวน์โหลดเสร็จ ให้เปิดไฟล์ปฏิบัติการและทำตามคำแนะนำการติดตั้ง

circle-info

ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง tesseract-64bit ไว้ที่ C:\Program Files\Tesseract-OCR

ไฟล์ข้อมูลฝึกฝน (ภาษา)

คุณสามารถดาวน์โหลด .traineddata ไฟล์สำหรับภาษาที่คุณต้องการและวางไว้ในไดเรกทอรีติดตั้ง Tesseract OCR C:\Program Files\Tesseract-OCR\tessdata\[ที่นี่] (ซึ่งควรจะเป็นตำแหน่งเดียวกับที่ติดตั้งไดเรกทอรี tessdata)

tessdata https://github.com/tesseract-ocr/tessdataarrow-up-right ความเร็ว : เร็วกว่า tessdata-best ความแม่นยำ : น้อยกว่า tessdata-best เล็กน้อย

tessdata-best (แนะนำสำหรับวิดีโอเกม) https://github.com/tesseract-ocr/tessdata_bestarrow-up-right ความเร็ว : ช้าที่สุด ความแม่นยำ : แม่นยำที่สุด

tessdata-fast https://github.com/tesseract-ocr/tessdata_fastarrow-up-right ความเร็ว : เร็วที่สุด ความแม่นยำ : แม่นยำน้อยที่สุด

โหมดการแบ่งส่วนหน้า

PSM ช่วยให้คุณเลือกวิธีการแบ่งส่วนตามภาพเฉพาะของคุณและสภาพแวดล้อมที่ถ่ายภาพนั้น

โหมดการแบ่งส่วนหน้า

1

การตรวจจับการวางแนวและสคริปต์ (OSD) เท่านั้น

2

การแบ่งส่วนหน้าอัตโนมัติพร้อม OSD

3

การแบ่งส่วนหน้าอัตโนมัติ แต่ไม่มี OSD หรือ OCR (ยังไม่ถูกใช้งาน)

4

การแบ่งส่วนหน้าอัตโนมัติเต็มรูปแบบ แต่ไม่มี OSD (ค่าเริ่มต้น)

5

สมมติคอลัมน์ข้อความเดี่ยวที่มีขนาดไม่เท่ากัน

6

สมมติบล็อกข้อความเดียวที่มีการจัดแนวแนวดิ่งอย่างสม่ำเสมอ

7

สมมติบล็อกข้อความเดียวที่สม่ำเสมอ

8

จัดการภาพเป็นบรรทัดข้อความเดียว

9

จัดการภาพเป็นคำเดียว

10

จัดการภาพเป็นคำเดียวในวงกลม

11

จัดการภาพเป็นอักขระเดียว

12

ข้อความกระจัดกระจาย ค้นหาข้อความให้มากที่สุดเท่าที่จะทำได้โดยไม่มีลำดับเฉพาะ

13

ข้อความกระจัดกระจายพร้อม OSD

14

บรรทัดดิบ จัดการภาพเป็นบรรทัดข้อความเดียว ข้ามการปรับแต่งที่เฉพาะสำหรับ Tesseract