รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2560

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคปลาย ปีการศึกษา 2559

ประเภทโครงงาน
โครงงานวิศวกรรม

ชื่อโครงงานภาษาไทย
โครงข่ายประสาทเทียมสำหรับการโมเดลภาษาไทย

ชื่อโครงงานภาษาอังกฤษ
Artificial Neural Network for Modeling Thai Language

ผู้พัฒนา
5610501008 ผดุงเกียรติ ตามาสี

อาจารย์ที่ปรึกษาหลัก
จันทนา จันทราพรชัย

อาจารย์ที่ปรึกษาร่วม
หัชทัย ชาญเลขา

บทคัดย่อ

การสร้างโมเดลขอภาษาไทยนั้นจะถูกสร้างขึ้นในระดับของคำเพียงเท่านั้น ซึ่งยังเป็นเรื่องที่ทำได้ไม่ง่ายนักเพราะภาษาไทยเป็นภาษาที่ไม่มีโครงสร้าง โครงงานถูกพัฒนาขึ้นเพื่อให้สามารถสร้างโมเดลของภาษาไทยในวิธีการอื่น ทั้งในระดับของคำ ระดับของอักขระ และระดับของอักขระที่ระบุวิธีการสะกดเข้าไปในอักขระแต่ละตัว และได้ทำกับเอกสารที่มีการสะกดคำผิดหรือเป็นคำเฉพาะที่ไม่สามารถตัดคำออกมาแบบปกติได้ โดยเอกสารทั้งหมดนำมาจาก นิยาย ใน Website dek-d.com โดยที่การสร้างโมเดลในครั้งนี้จะทำโดยใช้ โครงข่ายประสาทเทียมแบบวนกลับชนิดพิเศษ Long Short-Term Memory (LSTM)

Abstract

A making of Thai language modeling is can be made only word model. It is not easy to modeling because the Thai language is a non-structured language. This project develops for making a modeling of Thai language in other ways include with word modeling, alphabet modeling and alphabet modeling with specific a pronunciation of each alphabet. It can use with documents that misspelling or use a word that cannot normally separate. The documents that we use to test are from novels on website dek-d.com. We use a special inverse neural network called “Long Short-Term Memory (LSTM)”

คำสำคัญ (Keywords)

Thai Language Model, Recurrent Neural Network, Thai Spelling Rule, Long Short-Term Memory (LSTM)

เว็บไซต์โครงงาน
-

วีดีโอคลิปของโครงงาน

ที่เก็บเวอร์ชันซอร์สโค้ด

https://github.com/QuAzZeR/lstm_thai


สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
ผดุงเกียรติ ตามาสี (b5610501008)

แก้ไขครั้งสุดท้าย
เมื่อ May 31, 2017, 10:13 p.m. โดย ผดุงเกียรติ ตามาสี (b5610501008)

สถานะการอนุมัติ
อนุมัติแล้ว โดย จันทนา จันทราพรชัย (fengcnc) เมื่อ June 5, 2017, 7:12 p.m.