วิธีการจับข้อความจากภาพด้วยซอฟต์แวร์ OCR

สิ่งหนึ่งที่ฉันมักจะผิดหวังคือการไม่สามารถคัดลอกข้อความออกจากรูปภาพและไฟล์ PDF บางไฟล์ได้อย่างง่ายดาย (เช่นสิ่งที่อาจถูกสร้างขึ้นจากเอกสารที่สแกน) โชคดีที่โซลูชันซอฟท์แวร์เมื่อเวลาผ่านไปได้รับการพัฒนาขึ้นเพื่อแก้ไขปัญหานี้ซึ่งช่วยให้ประหยัดเวลาได้อย่างมากซึ่งจะช่วยให้สามารถคัดลอกและพิมพ์ข้อความซ้ำได้ด้วยตนเอง ในคำแนะนำวันนี้ฉันจะพูดถึงเครื่องมือซอฟต์แวร์ฟรีที่ชื่อว่า Capture2Text ซึ่งใช้อัลกอริทึม Optical Character Recognition (OCR) ที่จะช่วยให้คุณสามารถจับข้อความจากภาพและไฟล์ PDF

การติดตั้งและตั้งค่า

ในการเริ่มต้นให้ไปที่หน้า SourceForge ของโครงการและดาวน์โหลด Capture2Text เวอร์ชันล่าสุด ซอฟต์แวร์มาเป็นไฟล์ zip และในเวลานั้นไม่รวมโปรแกรมติดตั้งเฉพาะ เมื่อดาวน์โหลดแล้วให้แตกไฟล์บีบอัดแล้วเปิดไฟล์ Capture2Text.exe นี่จะเป็นการเปิดตัวซอฟต์แวร์และวางไอคอนลงในถาดระบบ:

ขั้นแรกสิ่งที่คุณต้องทำคือตั้งค่าการกำหนดลักษณะของซอฟต์แวร์โดยเฉพาะปุ่มลัด (หรือทางลัด) เพื่อใช้ในการเริ่มและหยุดการจับภาพ:

ในกรณีของฉันฉันเลือกที่จะใช้ปุ่ม "Windows + q" เพื่อเริ่มการจับภาพและ "Enter" เพื่อหยุด คุณสามารถปรับตัวเลือกเหล่านี้เป็นสิ่งที่ดีที่สุดสำหรับคุณ โปรดทราบว่าคีย์“ Windows + s” มักใช้สำหรับการจับภาพหน้าจออยู่แล้ว (เช่นโดยโปรแกรมเช่น Microsoft One Note)

ในแท็บถัดไปตัวเลือก OCR สามารถกำหนดค่าได้รวมถึงภาษาที่ป้อน (ปัจจุบันรองรับเจ็ดภาษา) และจะใช้การประมวลผลล่วงหน้า OCR เพื่อปรับปรุงความแม่นยำหรือไม่ (แนะนำอย่างยิ่ง) ในที่สุดบนแท็บผลลัพธ์ระหว่างตัวเลือกอื่น ๆ คุณสามารถเลือกได้ว่าจะบันทึกข้อความที่จับไปยังคลิปบอร์ดหรือไม่หรือจะเปิดหน้าต่างป๊อปอัพแยกต่างหาก

การใช้ซอฟต์แวร์

เมื่อติดตั้งและกำหนดค่าซอฟต์แวร์แล้วคุณสามารถเริ่มใช้งานได้ผ่านการเริ่มจับภาพปุ่มลัดรวมกัน ใช้เมาส์ของคุณเลือกพื้นที่บนภาพที่มีข้อความที่คุณต้องการจับ หากต้องการหยุดการบันทึกเพียงกดปุ่มลัดที่คุณเลือกเพื่อหยุดการจับภาพ ข้อความจะถูกคัดลอกไปยังคลิปบอร์ดหน้าต่างป๊อปอัพเอาท์พุทหรือทั้งสองอย่าง ตัวอย่างสามารถดูได้ด้านล่าง

จากการทดสอบเครื่องมือด้วยภาพอย่างรวดเร็วฉันพบว่าความถูกต้องเหมาะสม เห็นได้ชัดว่ามีข้อ จำกัด สำหรับเครื่องมือเช่นนี้และ OCR โดยทั่วไป ตัวอย่างเช่นข้อความที่มีการปรับเปลี่ยนอย่างมาก (ตัวสะกดมากตัวเอียงหรือทันสมัย) อาจทำงานได้ไม่ดีนักและบางครั้งก็ไม่ได้เลย นอกจากนี้ในบางกรณีจะช่วยในการปรับขนาดกล่องจับภาพเล็กน้อยหรือเล่นด้วยการซูมบนภาพเพื่อให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น

เมื่อจับข้อความจากเอกสาร PDF ที่สแกนความถูกต้องก็โอเคด้วยการแก้ไขขั้นสุดท้ายโดยทั่วไปยังจำเป็นต้องใช้กับผลลัพธ์ที่บันทึกไว้ (ขึ้นอยู่กับคุณภาพของการสแกนครั้งแรก) นอกจากนี้ฉันสังเกตเห็นว่าซอฟต์แวร์อาจใช้เวลาประมวลผลนานสองสามวินาทีโดยเฉพาะอย่างยิ่งเมื่อถูกขอให้แปลงข้อความจำนวนมาก

ทุกอย่างถูกกล่าวโดยรวมแล้วฉันคิดว่าเครื่องมือนี้ทำงานได้ดีโดยเฉพาะอย่างยิ่งเมื่อมีให้ใช้อย่างอิสระฉันขอแนะนำให้คุณลองใช้งาน

ภาคผนวก 11/16/2015:

เป็นอีกตัวเลือกหนึ่งสำหรับผู้ที่มีบัญชี Google คุณสามารถใช้ความสามารถ OCR ของ Google ได้โดยการอัปโหลดไฟล์ไปยัง Google Drive ของคุณ (ดูรายละเอียดเพิ่มเติมได้ที่นี่) นอกจากนี้ยังมีปลั๊กอิน OCR สำหรับผู้ใช้ Google Chrome ที่เรียกว่า Copyfish ซึ่งคุณอาจต้องการดูเช่นกัน

การติดตั้งและตั้งค่า

การใช้ซอฟต์แวร์

ตัวเลือกของบรรณาธิการ

แล้วเสียงเรียกเข้า iPhone คืออะไรล่ะ อันที่จริงมันก็เป็นแค่ iTunes ธรรมดา