หลักสูตร/ปี พ.ศ. วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2563
ภาคและปีการศึกษาที่สำเร็จการศึกษา ภาคปลาย ปีการศึกษา 2562
ประเภทโครงงาน
โครงงานวิศวกรรม
ชื่อโครงงานภาษาไทย
การสกัดคำสำคัญอัตโนมัติจากบทความวิชาการ
ชื่อโครงงานภาษาอังกฤษ
Automatic Keyword Extraction from Research Articles
ผู้พัฒนา
5910500481 ณิชา ลิ้มมณี
อาจารย์ที่ปรึกษาหลัก
หัชทัย ชาญเลขา
อาจารย์ที่ปรึกษาร่วม
-
บทคัดย่อ
โครงงานนี้ผู้จัดทำได้ทำการศึกษาวิธีการในการสกัดคำสำคัญอัตโนมัติเบื้องต้น โดยหลังจากประเมินข้อมูลที่ใช้และตัววิธีหลายๆ วิธีแล้ว ผู้จัดทำได้เลือกใช้วิธีทางสถิติเพื่อทำการสกัดคำสำคัญ มุ่งเน้นขั้นตอนวิธีการเรียนรู้แบบไม่กำกับ (unsupervised learning) และฝึกสอนจากข้อมูลที่ไม่มีป้ายกำกับ บนโดเมนของงานตีพิมพ์วิชาการของภาคการเกษตร
ผลการศึกษาพบว่าการเลือกใช้วิธีการตัดคำแบบ 4-gram ผสานกับการเลือกพิจารณาคำนาม ช่วยให้สามารถได้รายการคำสำคัญที่มีความหมายมากที่สุดเทียบกับขนาดของการพิจารณาอื่นๆ
Abstract
In this study, we have studied various automatic keyword extraction methods. By traveling through the data we have and the method we learnt, we decided to use statistic approach for keyword extracting. The model was trained from unlabeled data, focusing on unsupervised learning and the domain of agriculture.
The result shows that using 4-gram tokenizing and selecting only noun phrases help us obtaining the best list of keywords comparing to other methods.
คำสำคัญ (Keywords)
การประมวลผลภาษาธรรมชาติ, การสกัดคำสำคัญ, วิธีทางสถิติ, การเรียนรู้แบบไม่กำกับ
เว็บไซต์โครงงาน
-
ที่เก็บเวอร์ชันซอร์สโค้ด
-
ผู้นำเข้าข้อมูลครั้งแรก
ณิชา
ลิ้มมณี
(b5910500481)
แก้ไขครั้งสุดท้าย
เมื่อ May 9, 2020, 7:26 p.m. โดย
ณิชา
ลิ้มมณี
(b5910500481)
สถานะการอนุมัติ
รออนุมัติ