หลักสูตร/ปี พ.ศ. วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2559
ภาคและปีการศึกษาที่สำเร็จการศึกษา ภาคปลาย ปีการศึกษา 2558
ประเภทโครงงาน
โครงงานวิศวกรรม
ชื่อโครงงานภาษาไทย
การตรวจจับเหตุการณ์สําคัญจากกระแสข้อมูลบนทวิตเตอร์
ชื่อโครงงานภาษาอังกฤษ
Event Detection from Twitter Data Stream
ผู้พัฒนา
5510504064 บดินทร์ ชินธเนศ
อาจารย์ที่ปรึกษาหลัก
บัณฑิต มนัสเกษมศักดิ์
อาจารย์ที่ปรึกษาร่วม
อานนท์ รุ่งสว่าง
บทคัดย่อ
ในปัจจุบันออนไลน์โซเชียลเน็ตเวิร์กได้กลายเป็นช่องยอดนิยมสำหรับเผยแพร่ข้อมูลข่าวสารต่างๆ ดังนั้นจึงมีข้อมูลมากมายถูกสร้างขึ้นมาตลอดเวลา ทำให้ผู้ใช้งานไม่สามารถอ่านข้อมูลต่างๆ และ หาว่าตอนนี้กำลังเกิดอะไรขึ้นบนโซเชียลเน็ตเวิร์กได้ เพื่อช่วยให้ผู้ใช้งานโซเชียลเน็ตเวิร์กสามารถติดตามข่าวสารที่สำคัญได้ง่ายยิ่งขึ้น เราจึงควรจะสร้างระบบสำหรับตรวจจับเหตุการณ์สำคัญขึ้นมา ในโครงงานชิ้นจึงเน้นการสร้างระบบตรวจจับเหตุการณ์สำคัญจากกระแสข้อมูลบนทวิตเตอร์ผ่านทาง Streaming API ขั้นแรกเราจะพยายามหาคำสำคัญที่อยู่ในแต่ละทวีตโดยการใช้ไลบรารี่ Spacy ซึ่งเป็นตัวช่วยทางภาษาศาสตร์ และสร้างระบบที่จะหากลุ่มคำสำคัญที่ปรากฏบ่อยๆในกระแสข้อมูลโดยอาศัยวิธีการ Apriori โดยแต่ละกลุ่มคำจะถูกเรียกว่าปรากฏบ่อยก็ต่อเมื่อมันปรากฏมากๆภายในช่วงเวลาที่เราสนใจ และ ไม่เคยเกิดขึ้นในช่วงเวลาก่อนหน้า สุดท้ายเราจะนำรายการของกลุ่มคำที่ปรากฏบ่อยไปแสดงเป็นรายการของเหตุการณ์ที่สำคัญที่เกี่ยวข้องกับกลุ่มคำนั้นๆ ผ่านทางหน้าโมบายแอปพลิเคชัน เราหวังว่าโครงงานชิ้นนี้จะสามารถช่วยให้ผู้ใช้งานโซเชียลเน็ตเวิร์กได้รับข้อมูลข่าวสารเกี่ยวกับเหตุการณ์ต่างได้สะดวงและแม่นยำมากยิ่งขึ้น
Abstract
Nowadays, the online social network becomes a popular medium to share information. There are massive information generated all time. Therefore, It is very hard to read all information and find what is happening right now. To help online social network users read importance information easily, we need an event detection system. This project focuses on detecting events from real time Twitter data stream obtaining from the Twitter Streaming API. First, we extract a set of terms from each tweet by using Spacy library (natural language processing tool), and create the system to find the frequent set of terms in data stream by using Apriori algorithm. Each set of terms can be defined as emerging if it frequently occurs in a specific time interval (it did rarely occur in the past). Then, we select a set of emerging terms and rank then according to their scores by frequency of terms. Finally, we show list of events with mobile application interface. We believe that this project will help people to receive information of events easier and more accurate.
คำสำคัญ (Keywords)
event detection, twitter, itemset
เว็บไซต์โครงงาน
-
ที่เก็บเวอร์ชันซอร์สโค้ด
https://github.com/gotzillaz/event-detection-from-osk
https://github.com/gotzillaz/web-server-event-detection
https://github.com/gotzillaz/android-event-detection
https://gitlab.mikelab.net/bodin/event-detection-redbook
ผู้นำเข้าข้อมูลครั้งแรก
บดินทร์
ชินธเนศ
(b5510504064)
แก้ไขครั้งสุดท้าย
เมื่อ June 2, 2016, 5:06 p.m. โดย
บดินทร์
ชินธเนศ
(b5510504064)
สถานะการอนุมัติ
อนุมัติแล้ว โดย
บัณฑิต
มนัสเกษมศักดิ์
(fengbdm)
เมื่อ Aug. 22, 2016, 9:28 a.m.