รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2563

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคปลาย ปีการศึกษา 2562

ประเภทโครงงาน
โครงงานวิศวกรรม

ชื่อโครงงานภาษาไทย
การสกัดคำสำคัญอัตโนมัติจากบทความวิชาการ

ชื่อโครงงานภาษาอังกฤษ
Automatic Keyword Extraction from Research Articles

ผู้พัฒนา
5910500481 ณิชา ลิ้มมณี

อาจารย์ที่ปรึกษาหลัก
หัชทัย ชาญเลขา

อาจารย์ที่ปรึกษาร่วม
-

บทคัดย่อ

โครงงานนี้ผู้จัดทำได้ทำการศึกษาวิธีการในการสกัดคำสำคัญอัตโนมัติเบื้องต้น โดยหลังจากประเมินข้อมูลที่ใช้และตัววิธีหลายๆ วิธีแล้ว ผู้จัดทำได้เลือกใช้วิธีทางสถิติเพื่อทำการสกัดคำสำคัญ มุ่งเน้นขั้นตอนวิธีการเรียนรู้แบบไม่กำกับ (unsupervised learning) และฝึกสอนจากข้อมูลที่ไม่มีป้ายกำกับ บนโดเมนของงานตีพิมพ์วิชาการของภาคการเกษตร
ผลการศึกษาพบว่าการเลือกใช้วิธีการตัดคำแบบ 4-gram ผสานกับการเลือกพิจารณาคำนาม ช่วยให้สามารถได้รายการคำสำคัญที่มีความหมายมากที่สุดเทียบกับขนาดของการพิจารณาอื่นๆ

Abstract

In this study, we have studied various automatic keyword extraction methods. By traveling through the data we have and the method we learnt, we decided to use statistic approach for keyword extracting. The model was trained from unlabeled data, focusing on unsupervised learning and the domain of agriculture.
The result shows that using 4-gram tokenizing and selecting only noun phrases help us obtaining the best list of keywords comparing to other methods.

คำสำคัญ (Keywords)

การประมวลผลภาษาธรรมชาติ, การสกัดคำสำคัญ, วิธีทางสถิติ, การเรียนรู้แบบไม่กำกับ

เว็บไซต์โครงงาน
-

วีดีโอคลิปของโครงงาน

ที่เก็บเวอร์ชันซอร์สโค้ด

สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
ณิชา ลิ้มมณี (b5910500481)

แก้ไขครั้งสุดท้าย
เมื่อ May 9, 2020, 7:26 p.m. โดย ณิชา ลิ้มมณี (b5910500481)

สถานะการอนุมัติ
รออนุมัติ