รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2563

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคปลาย ปีการศึกษา 2562

ประเภทโครงงาน
โครงงานวิศวกรรม

ชื่อโครงงานภาษาไทย
โปรแกรมแปลงรูปภาพเป็นข้อความสำหรับเอกสารราชการไทย

ชื่อโครงงานภาษาอังกฤษ
Optical Character Recognition Program for Thai Official Documents

ผู้พัฒนา
5810502431 วัชรฉัตร แปลงศรี

อาจารย์ที่ปรึกษาหลัก
พันธุ์ปิติ เปี่ยมสง่า

อาจารย์ที่ปรึกษาร่วม
-

บทคัดย่อ

โครงงานวิศวกรรมคอมพิวเตอร์ โปรแกรมแปลงรูปภาพเป็นข้อความสำหรับเอกสารราชการไทยงานนี้จัดทำขึ้นเพื่อพัฒนาวิธีการที่จะดึงข้อมูลตัวอักษรภาษาไทยจากภาพเอกสารราชการภาษาไทย เพื่อไม่ให้ข้อมูลเอกสารที่เป็นความลับรั่วไหลและสร้างความสะดวกรวดเร็วในการจัดเก็บบันทึกเอกสารที่ยังอยู่ในรูปแบบกระดาษ สู่ระบบคอมพิวเตอร์ เพื่อให้ง่ายต่อการสืบค้นใช้งาน โดยกระบวนการที่ใช้ในการจัดทำโครงงานนนี้ ประกอบด้วยการใช้ไลบรารี่ OpenCV บน Python3.6 ในการจัดการกับข้อมูลไฟล์ภาพและใช้อัลกอริทึม kNN ในการประมวลผล โดยจากการฝึกระบบด้วยเอกสารภาษาไทย 5 ชุด แล้วจึงทำการทดสอบจนผลเป็นที่น่าพอใจบนชุดทดสอบ 2 ชุด ได้ผลลัพธ์ความแม่นยำเฉลี่ย 70.22% บนเอกสารจริง 13 ชุด วัดผลโดยการใช้การวัดค่า Levenshtein Distance Ratio ซึ่งเป็นอัตราส่วน Levenshtein Distance กับความยาวข้อความ ได้ผลเป็นที่น่าพอใจ แต่ยังสามารถปรับปรุงได้โดยปรับปรุงวิธีการตัดตัวอักษรภาษาไทยและพัฒนาความสามารถของระบบประมวลผล ระบบนี้จึงจะสามารถพัฒนาได้ดียิ่งขึ้นไป

Abstract

This Computer Engineering Project, Optical Character Recognition Program for Thai Official Documents is developed for the purpose of developing a way to extract text information from pictures of Thai Official Documents. For the purpose of preventing leakage of secretive documents and to increase the ease in the process of storing documents which are still in paper form onto Computer Systems. Which will aid in the process of storage and in searching those documents. The approach in which this project adopts are composed of using the OpenCV library on Python3.6 to handle image manipulation tasks and uses the kNN algorithm to classify and compute the correct Thai character from the input images. From training the classification model with 5 documents and testing it on 2 documents before trying it on more documents results in the average accuracy of 70.22% experimented on 13 more documents. Which is measured in Levenshtein Distance Ratio which is the application of the ratio between the Levenshtein Distance and the length of the text used to measure similarity. These results are satisfactory but can be further improved upon by further developing the methods used in the process of extracting images of each individual Thai characters and in further developing the classification module.

คำสำคัญ (Keywords)

Optical Character Recognition, Image Processing, k Nearest Neighbors, OpenCV, Python, Levenshtein Distance

เว็บไซต์โครงงาน
https://watcharachatmpbg.github.io/ImgPro-Project/

วีดีโอคลิปของโครงงาน

ที่เก็บเวอร์ชันซอร์สโค้ด

https://github.com/WatcharachatMPBG/ImgPro-Project


สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
วัชรฉัตร แปลงศรี (b5810502431)

แก้ไขครั้งสุดท้าย
เมื่อ May 12, 2020, 9:26 a.m. โดย วัชรฉัตร แปลงศรี (b5810502431)

สถานะการอนุมัติ
รออนุมัติ