รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
ปรัชญาดุษฎีบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2565

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคปลาย ปีการศึกษา 2564

ประเภทโครงงาน
วิทยานิพนธ์

ชื่อโครงงานภาษาไทย
วิธีการคัดแยกจุดรอยนูนของอักษรเบรลล์สำหรับภาพเอกสารอักษรเบรลล์

ชื่อโครงงานภาษาอังกฤษ
Method of Braille Embossed Dots Segmentation for Braille Document Images

ผู้พัฒนา
5717500211 ศศิน เทียนดี

อาจารย์ที่ปรึกษาหลัก
จเร เลิศสุดวิชัย

อาจารย์ที่ปรึกษาร่วม
-

บทคัดย่อ

อักษรเบรลล์เป็นภาษาสื่อสารสำหรับคนตาบอดและผู้พิการทางสายตา มีลักษณะเป็นจุดรอยนูนที่ตำแหน่งต่าง ๆ เพื่อใช้สื่อความหมาย เอกสารอักษรเบรลล์สามารถสร้างบนกระดาษขาวเรียบและกระดาษที่ใช้ซ้ำได้เป็นที่รู้จักกันในชื่อเรียกว่ากระดาษหน้าที่สาม ซึ่งช่วยลดต้นทุนค่ากระดาษ งานวิจัยนี้นำเสนอวิธีการคัดแยกจุดรอยนูนของอักษรเบรลล์สำหรับภาพเอกสารอักษรเบรลล์ที่ผลิตบนกระดาษที่ใช้ซ้ำได้ มีลำดับขั้นตอนดังนี้ ขั้นตอนที่ 1 ทำการสแกนภาพสี่เหลี่ยมและวงกลมสีดำ เพื่อใช้ในการคำนวณหาค่าขีดแบ่ง (Thresholding) ประจำเครื่องสแกนเนอร์นั้น ๆ และทำการสแกนเอกสารอักษรเบรลล์ด้วยเครื่องสแกนเนอร์ตัวเดียวกันนี้ ขั้นตอนที่ 2 นำค่าขีดแบ่งประจำเครื่องสแกนเนอร์มาทำการคำนวณการแยกชั้นเอกสารอักษรเบรลล์ ซึ่งจะทำให้ได้ (1) ภาพเอกสารอักษรเบรลล์ที่มีขอบภาพของลวดลายตัวอักษรปกติและเงาของจุดรอยนูนของอักษรเบรลล์ (2) ภาพเอกสารอักษรเบรลล์ที่เป็นบริเวณพื้นที่สีดำของลวดลายตัวอักษรปกติ ขั้นตอนที่ 3 ทำการลบขอบภาพของลวดลายตัวอักษรปกติ เพื่อให้เหลือแต่เงาของจุดรอยนูนของอักษรเบรลล์ ขั้นตอนที่ 4 ทำการกู้คืนจุดรอยนูนของอักษรเบรลล์ที่อาจจะซ้อนทับอยู่บนตัวอักษรปกติ ในลำดับถัดมา ทำการลบสัญญาณรบกวนด้วยเทคนิคการกระจายกลุ่มสีและใช้ตัวกรองค่ามัธยฐาน (Median Filter) เพื่อปรับปรุงภาพ ทำให้ได้บริเวณที่เป็นจุดรอยนูนของอักษรเบรลล์ และสุดท้ายทำการขยายพื้นที่ของจุดรอยนูนของอักษรเบรลล์ด้วยการเทคนิคการขยาย (Dilation) จากนั้นใช้เทคนิคการติดฉลากส่วนประกอบที่เชื่อมต่อ (Component Connected Labeling) เพื่อระบุจุดตำแหน่งของจุดรอยนูนของอักษรเบรลล์ ขอบเขตข้อจำกัดของงานวิจัยนี้ คือ กระดาษที่ใช้ซ้ำได้เป็นกระดาษที่พิมพ์ด้วยตัวอักษรปกติเท่านั้น ไม่มีภาพประกอบ ไม่มีบริเวณส่วนเน้น (Highlight)

งานวิจัยนี้ได้ทำการทดสอบกับ (1) ชุดข้อมูล Braille-Dots เอกสารอักษรเบรลล์ที่สร้างบนกระดาษที่ใช้ซ้ำได้ นำมาสแกนด้วยเครื่องสแกนเนอร์ 4 เครื่อง ทำการครอบตัดบริเวณส่วนภาพขนาด 40x40 พิกเซล มีผลการทดสอบประสิทธิภาพอยู่ในระดับดีเยี่ยมโดยมีค่าอัตราการรู้จำ (F-Measure) มากกว่า 0.9000 (2) ชุดข้อมูล Braille-Partial ภาพเอกสารอักษรเบรลล์ที่สร้างบนกระดาษที่ใช้ซ้ำได้มาทำการสแกนด้วยเครื่องสแกนเนอร์ 4 เครื่อง และทำการครอบตัดส่วนภาพที่ต้องการบางส่วน มีผลการทดสอบประสิทธิภาพที่โดดเด่นและมีแนวโน้มที่ดี โดยมีความแม่นยำ (Accuracy) มากกว่า 0.9000 และ (3) ชุดข้อมูล Braille-Real ภาพเอกสารอักษรเบรลล์ที่สร้างบนกระดาษที่ใช้ซ้ำได้ที่พิมพ์ด้วยตัวอักษรอย่างเดียว ผลการทดสอบประสิทธิภาพมีแนวโน้มที่ดี ซึ่งมีอัตราการรู้จำมากกว่า 0.8000 ในส่วนของภาพเอกสารอักษรเบรลล์ที่สร้างบนกระดาษที่ใช้ซ้ำได้ที่เป็นรูปวาดลวดลายที่มีร่องรอยเงาแสงที่พาดผ่านของเครื่องสแกนเนอร์ ภาพข่าวพร้อมข้อความ ภาพประกอบ และบริเวณส่วนเน้น มีประสิทธิภาพที่ลดลง เนื่องจากมีจุดรอยนูนเกิดบนบริเวณพื้นที่สีเข้มทึบ ทำให้วิธีการนี้ไม่สามารถคัดแยกจุดรอยนูนของอักษรเบรลล์ได้ ซึ่งในส่วนนี้จะนำไปพัฒนาให้ดีขึ้นต่อไปในอนาคต

Abstract

Braille is a communicative language for blind and visually impaired people. Embossed dots characterize it at distinct locations to convey the meaning. Braille documents can be created on plain white paper and reusable paper, also known as third-page paper, which reduces paper costs. This research presents a method for segmentation of Braille embossed dots for images of Braille documents produced on reusable paper. There were sequences of steps as follows. First, a black rectangle and circle were scanned to calculate the threshold value obtained from the scanner, and the Braille document was scanned with the same scanner. Second, the Braille document layer separation was calculated by using the threshold values obtained in the previous step. The results were (1) the image edges of the typical letter pattern and the shadow of the Braille embossed dots and (2) the image of the black areas of the typical letter pattern. Third, the image edges of the typical letter pattern were removed. The result was that the shadow region of the Braille embossed dots remained. Fourth, Braille embossed dots that may have been superimposed on the typical letter pattern were restored. Next, the noise was removed with a diffusion technique, and a median filter was applied. The result was an image of Braille embossed dots. Finally, the area of Braille embossed dots was enlarged by dilation technique, and then Component Connected Labeling was used to localize the Braille embossed dots. The limited scope of this research is that the reusable paper is paper printed with typical letters only, with no illustrations and no highlight area.

This research performed tests on (1) The Braille-Dot dataset: Braille documents were created on reusable paper. It was scanned with four scanners and cropped over a 40x40 pixel image area. The performance test results are excellent, with F-Measure above 0.9000. (2) The Braille-Partial dataset: the images of a Braille document created on reusable paper are scanned with four scanners and partially cropped to the desired image. The performance test results are outstanding and promising, with an accuracy above 0.9000. (3) The Braille-Real dataset: the images of Braille documents created on actual reusable paper, printed with only letters. The performance test results are promising, with F-Measure above 0.8000. An image of a Braille document created on reusable paper contains a patterned drawing with scanned shadows, a news image with text, an illustration, and a highlight area. The test has reduced efficiency because Braille embossed dots were in the dark area, making it impossible to distinguish them. This section will be developed further in the future.

คำสำคัญ (Keywords)

Braille; embossed dots; document images; reusable paper; segmentation; recognition; blind; visually impaired

เว็บไซต์โครงงาน
-

วีดีโอคลิปของโครงงาน
-

ที่เก็บเวอร์ชันซอร์สโค้ด

-


สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
ศศิน เทียนดี (g5717500211)

แก้ไขครั้งสุดท้าย
เมื่อ Aug. 22, 2022, 4:40 p.m. โดย ศศิน เทียนดี (g5717500211)

สถานะการอนุมัติ
รออนุมัติ