หลักสูตร/ปี พ.ศ. วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2561
ภาคและปีการศึกษาที่สำเร็จการศึกษา ภาคปลาย ปีการศึกษา 2560
ประเภทโครงงาน
โครงงานวิศวกรรม
ชื่อโครงงานภาษาไทย
การพัฒนาซอฟต์แวร์เครื่องมือเพื่อสร้างแบบจำลองในการรู้จำ Named Entity ภาษาไทย
ชื่อโครงงานภาษาอังกฤษ
A Development of Software Tool for Learning Thai Named Entity Recognition Model
ผู้พัฒนา
5710503380 ติณห์ เจริญรุ่งอุทัย
5710505412 พศวัต องค์มรกต
อาจารย์ที่ปรึกษาหลัก
หัชทัย ชาญเลขา
อาจารย์ที่ปรึกษาร่วม
-
บทคัดย่อ
ในการประมวลผลภาษาไทยนั้น ปัญหาที่สำคัญอย่างหนึ่ง คือ การรู้จำชื่อเฉพาะ หรือ Named Entity ต่างๆ เนื่องจากชื่อเฉพาะมักเป็นคำที่ไม่มีในพจนานุกรม รวมทั้งมีชื่อใหม่เกิดขึ้นอยู่ตลอดเวลา เพื่อลดปัญหาดังกล่าว จึงจำเป็นต้องมีระบบสำหรับวิเคราะห์ Named Entity เพื่อช่วยในการระบุตำแหน่งและขอบเขตของชื่อ รวมทั้งประเภทของชื่อนั้นๆ อย่างไรก็ดี การพัฒนาระบบดังกล่าว ต้องอาศัยความรู้ในด้านการประมวลผลภาษาธรรมชาติและการเขียนโปรแกรม รวมไปถึงเทคนิค Machine Learning
เพื่อให้การพัฒนาระบบรู้จำชื่อเฉพาะทำได้ง่ายขึ้นสำหรับผู้ที่ไม่มีพื้นฐานในการเขียนโปรแกรม แต่ต้องการพัฒนาแบบจำลองในการรู้จำ Named Entity โครงงานนี้จึงได้พัฒนาเครื่องมือสำหรับสร้างแบบจำลองในการรู้จำ Named Entity ในภาษาไทย โดยผู้ใช้สามารถสร้างแบบจำลองโดยการอัพโหลดคลังเอกสารสำหรับฝึกสอนแบบจำลองเข้าไปในระบบ รวมทั้งกำหนดค่าพารามิเตอร์ต่างๆ ผ่านทางส่วนติดต่อผู้ใช้ซึ่งอยู่ในรูปแบบของ web interface นอกจากนี้ เครื่องมือยังมีแบบจำลองที่ผ่านการฝึกสอนไว้แล้ว เพื่อให้ผู้ใช้สามารถนำไปใช้งานได้เลยกรณีที่ไม่มีคลังเอกสารสำหรับฝึกสอนระบบ โดยในส่วนของการฝึกสอนแบบจำลองสำหรับรู้จำ Named Entity นั้น โครงงานนี้ใช้เทคนิค Conditional Random Fields
Abstract
In Thai natural language processing, Named Entity is one of the complicated problems to deal with. Presently most of this problems are managed manually by human and it seem to be the important issue in the future. Because of the rapidly data increment, reducing time and resource is the problem that must be solved. So in order of human labor, Named entity analysis system can be used instead to save more cost and time. However, to develop a named entity recognition system, skill and knowledge of natural language processing, programming and Machine Learning is most required.
For the benefits of developing Named Entity Recognition, to people who does not expert in programming field, this project is the easier way for constructing Thai Named Entity recognition model. The user can create model by uploading corpus for modeling training into the system, including parameter configuration by the user interface, which is in the form of a web interface. Moreover, there is a default model available for users to use in case of corpus is not exist for training model. All in all, the Named Entity Recognition Model in this project is implemented by the Conditional Random Fields.
คำสำคัญ (Keywords)
Named Entity, Named Entity Recognition Model, Corpus, Machine Learning, Conditional Random Fields, Web Interface
เว็บไซต์โครงงาน
-
ที่เก็บเวอร์ชันซอร์สโค้ด
-
ผู้นำเข้าข้อมูลครั้งแรก
พศวัต
องค์มรกต
(b5710505412)
แก้ไขครั้งสุดท้าย
เมื่อ July 9, 2018, 9 p.m. โดย
พศวัต
องค์มรกต
(b5710505412)
สถานะการอนุมัติ
รออนุมัติ