ต้องทำการแปลงเอกสารจำนวนมากที่เขีียนด้วยมือหรือพิมพ์ ให้เป็นไฟล์ ก็ต้องเกี่ยวข้องกับเทคโนโลยี OCR นั่นเอง ค้นดูจากวิกิพีเดียทำให้รู้ว่าเดี๋ยวนี้ซอฟท์แวร์พวกนี่ค่อนข้างเก่งแล้ว โดยเฉพาะที่เป็นแบบ Commercial ล่ะก็ มีฟีเจอร์ต่าง ๆ เพียบ เช่น สามารถเลือก output ได้หลายแบบ แต่ก็ต้องจ่ายเงินประมาณ 2x,xxx เพื่อแลกมา
แล้วถ้าเป็น Opensource ล่ะก็มีเหมือนกัน อาจจะไม่มีฟีเจอร์หรูหราเท่าแต่ตอนนี้ก็พอใช้ได้ มีอยู่ตัวนึงชื่อ Tesseract ริเริ่มโดย Hewlett-Packard ปัจจุบันดูแลโดย Google ครับ
No comments:
Post a Comment