รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2567

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคต้น ปีการศึกษา 2567

ประเภทโครงงาน
วิทยานิพนธ์

ชื่อโครงงานภาษาไทย
การตรวจจับเหตุการณ์ในทวิตเตอร์โดยการใช้การจัดกลุ่มของกราฟการเกิดร่วม

ชื่อโครงงานภาษาอังกฤษ
Entity Co-occurrence Graph-based Clustering for Twitter Event Detection

ผู้พัฒนา
6614500635 นายณัฐกิตต์ เนตรศิวะวิเชียร

อาจารย์ที่ปรึกษาหลัก
บัณฑิต มนัสเกษมศักดิ์

อาจารย์ที่ปรึกษาร่วม
อานนท์ รุ่งสว่าง

บทคัดย่อ

กระแสข้อมูลทางสังคมจากแพลตฟอร์มออนไลน์ที่มีอยู่ เช่น ทวิตเตอร์ หรือ X มักนำเสนอข้อมูลเกี่ยวกับเหตุการณ์ปัจจุบันที่ทันสมัยและล่าสุดอยู่เสมอ การตรวจจับและจัดประเภทเนื้อหาของทวิตเตอร์ที่เกี่ยวข้องกับเหตุการณ์ถือเป็นหนึ่งในงานวิจัยที่ท้าทาย โดยที่ผ่านมา มีนักวิจัยหลายท่านได้ให้ความสนใจมาเป็นเวลาหลายปีแล้ว สำหรับในวิทยานิพนธ์นี้ ผู้วิจัยได้นำเสนอวิธีการในการระบุเหตุการณ์ที่เกิดขึ้นจากข้อความทวิต และได้ออกแบบขั้นตอนวิธีการซึ่งกล่าวโดยสรุปได้ดังนี้ (1) การแทนข้อความทวีตด้วยชุดของคำเอนทิตีโดยใช้เทคโนโลยีการรู้จำชื่อเอนทิตี (Named Entity Recognition) (2) การสร้างกราฟซึ่งแสดงถึงความสัมพันธ์ระหว่างเอนทิตีที่เกิดร่วมกันในทวีต (3) การประยุกต์ใช้อัลกอริทึมการจัดกลุ่มซึ่งมีอยู่หลากหลายวิธีกับกราฟความสัมพันธ์ดังกล่าว เพื่อให้ได้เป็นส่วนกราฟย่อยที่เกาะกลุ่มกันหนาแน่นเป็นส่วน ๆ และสุดท้าย (4) การจำแนกข้อความทวีตที่ความสอดคล้องกับแต่ละกราฟย่อย (อาจเรียกว่า กลุ่ม) ซึ่งจะหมายถึงแต่ละเหตุการณ์ที่เกิดขึ้นนั่นเอง ในการทดลอง ผู้วิจัยได้ดำเนินการบนชุดข้อมูลทวิตเตอร์มาตรฐานจำนวนสองชุด และผลการทดลองแสดงให้เห็นว่าวิธีการที่นำเสนอนั้นมีประสิทธิภาพดีกว่าวิธีการที่ผ่านมา นอกจากนี้ การตรวจจับเหตุการณ์สำคัญในลำดับต้น ๆ ยังมีความถูกต้องแม่นยำอย่างมีนัยยะอีกด้วย

Abstract

Social streams from existing online platforms such as Twitter or X have consistently shown the most up-to-date information about current events. Detecting and categorizing Twitter content connected to events is one of the most challenging tasks. Many researchers have therefore been interested in this issue for many years. In this paper, we propose an approach to identifying events that occurred from tweet text. To accomplish this goal, (1) tweets are first decomposed into sets of representative word-entities using NER technology; (2) a graph representing relationships between co-occurring entities is created; (3) several clustering methods are investigated on the graph; and finally, (4) tweets are assigned to the locally dense subgraphs (i.e., clusters) as identified events. Experiments conducted on two standard Twitter datasets demonstrate that the proposed strategy outperforms state-of-the-art methods. The results also show the achievement of accurately detecting significant events at the top of the ranking results.

คำสำคัญ (Keywords)

ทวิตเตอร์
การตรวจจับเหตุการณ์

เว็บไซต์โครงงาน
-

วีดีโอคลิปของโครงงาน
-

ที่เก็บเวอร์ชันซอร์สโค้ด

-


สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
นายณัฐกิตต์ เนตรศิวะวิเชียร (g6614500635)

แก้ไขครั้งสุดท้าย
เมื่อ Nov. 5, 2024, 11:38 a.m. โดย นายณัฐกิตต์ เนตรศิวะวิเชียร (g6614500635)

สถานะการอนุมัติ
รออนุมัติ