หลักสูตร/ปี พ.ศ. วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2561
ภาคและปีการศึกษาที่สำเร็จการศึกษา ภาคปลาย ปีการศึกษา 2560
ประเภทโครงงาน
โครงงานวิศวกรรม
ชื่อโครงงานภาษาไทย
ระบบตรวจจับเหตุการณ์สําคัญจากกระแสข้อมูลบนทวิตเตอร์
ชื่อโครงงานภาษาอังกฤษ
Event Detection from Twitter Data Stream
ผู้พัฒนา
5710500291 ชวนากร ศรีละมุล
อาจารย์ที่ปรึกษาหลัก
บัณฑิต มนัสเกษมศักดิ์
อาจารย์ที่ปรึกษาร่วม
อานนท์ รุ่งสว่าง
บทคัดย่อ
ในปัจจุบันเครือข่ายสังคมออนไลน์ ได้เข้ามาเป็นส่วนหนึ่งในชีวิตประจำของมนุษย์ ทั้งเป็นช่องทางสำหรับการติดต่อสื่อสาร และ เผยแพร่ข้อมูลต่างๆ ที่เข้าถึงได้ง่ายและรวดเร็ว ทำให้บนเครือข่ายสังคมออนไลน์ มีข้อมูลมากมายถูกสร้างขึ้นตลอดเวลา เพื่อช่วยให้ผู้ใช้งานสามารถรับรู้เหตุการณ์ต่างๆ ที่กำลังเกิดขึ้นได้ โดยไม่จำเป็นต้องอ่านข้อมูลจำนวนมากด้วยตัวเอง เราจึงควรจะสร้างระบบสำหรับตรวจจับเหตุการณ์สำคัญขึ้นมา ในโครงงานชิ้นจึงเน้นการพัฒนาระบบตรวจจับเหตุการณ์สำคัญจากกระแสข้อมูลบนทวิตเตอร์ จากสมมติฐานที่ว่าเหตุการณ์คือกลุ่มของทวีตที่คล้ายคลึงกัน เราจึงใช้อัลกอริทึมการจัดกลุ่มบนกราฟ เพื่อจัดกลุ่มทวีตที่เกี่ยวข้องกันเป็นเหตุการณ์เดียวกัน ซึ่งการสร้างกราฟ สร้างจากข้อมูลของทวีตแต่ละทวีต และเชื่อมต่อกันด้วยความคล้ายกันของเนื้อหา ก่อนที่จะเชื่อมต่อเหตุการณ์ที่คล้ายกันในช่วงเวลาใกล้เคียงกันเป็นเหตุการณ์เดียวกัน สุดท้ายเหตุการณ์ที่ไม่เชื่อมต่อไปยังช่วงเวลาก่อนหน้าก็จะกลายเป็นเหุการณ์สำคัญที่เกดขึ้นใหม่ การประเมินผลการทำงานของแนวทางที่เสนอเปรียบเทียบกับคำตอบของข้อมูลมีความแม่นยำ อยู่ตั้งแต่ 40-80%
Abstract
Nowadays, the online social network becomes a part of human life. It is a channel for communication and dissemination of information that is quick and easy accessed. There are massive information generated all time. To help online social network users to read importance information easily, we need an event detection system. In this paper we propose to develop system to detect important events from Twitter data stream. Based on the assumption that an event denotes a set of similar tweets. We define a tweet graph representing tweet term vectors as vertices associated by their content similarities. So, we use the graph clustering algorithm to group related tweets, and then connect the similar events between consecutive time. Finally, an event that does not connect to the previous time will become the emerging event. Experimental results conducted on Tweet dataset with pre-labeled events show that the proposed approach can provide 40-80% of precision in detecting emerging events
คำสำคัญ (Keywords)
event detection; twitter data stream; graph clustering; tweet graph construct
เว็บไซต์โครงงาน
-
ที่เก็บเวอร์ชันซอร์สโค้ด
-
ผู้นำเข้าข้อมูลครั้งแรก
ชวนากร
ศรีละมุล
(b5710500291)
แก้ไขครั้งสุดท้าย
เมื่อ June 14, 2018, 9:17 a.m. โดย
ชวนากร
ศรีละมุล
(b5710500291)
สถานะการอนุมัติ
รออนุมัติ