รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2562

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคต้น ปีการศึกษา 2561

ประเภทโครงงาน
วิทยานิพนธ์

ชื่อโครงงานภาษาไทย
การตรวจสอบสแปมความคิดเห็นโดยวิธีการแบ่งกราฟพฤติกรรมผู้ใช้

ชื่อโครงงานภาษาอังกฤษ
Opinion Spam Detection through User Behavioral Graph Partition Approach

ผู้พัฒนา
5614550054 ชญาดา จันมาค้อ

อาจารย์ที่ปรึกษาหลัก
บัณฑิต มนัสเกษมศักดิ์

อาจารย์ที่ปรึกษาร่วม
อานนท์ รุ่งสว่าง

บทคัดย่อ

ในบทวิจารณ์ออนไลน์ความคิดเห็นของผู้ใช้งานเป็นส่วนที่สำคัญ นอกจากจะได้ช่วยผู้บริโภคในการตัดสินใจจากข้อดีข้อเสียของสินค้าจากผู้ใช้งานจริงที่ได้มาออกความคิดเห็นแล้ว ยังช่วยผู้ผลิตเพื่อปรับปรุงพัฒนาคุณภาพของผลิตภัณฑ์หรือบริการอีกด้วย แต่เนื่องจากเหตุผลทางการตลาด ทำให้มีความคิดเห็นของผู้ใช้งานที่ไม่เป็นความจริงหรือสแปม (spam) ถูกเขียนขึ้นเพื่อส่งเสริมหรือทำลายความน่าเชื่อถือผลิตภัณฑ์ ซึ่งกลายเป็นปัญหาสำคัญ จากมูลเหตุนี้ทำให้มีนักวิจัยหลายทีมสนใจและนำมาวิเคราะห์โดยกระบวนการต่างๆ เช่นการใช้วิธีการเรียนรู้แบบอาศัยตัวอย่าง (supervised learning) เป็นวิธีที่มีประสิทธิผลในการตรวจจับสแปมโดยใช้การเรียนรู้ทางสถิติ แต่มีค่าใช้จ่ายต้นทุนที่สูงสำหรับการติดฉลากข้อมูลฝึกสอน (training dataset) วิทยานิพนธ์นี้นำเสนอ BeGP ซึ่งเป็นวิธีการการตรวจสอบสแปมความคิดเห็นโดยวิธีการแบ่งกราฟพฤติกรรมผู้ใช้ โดยเริ่มจากสกัดชุดคุณสมบัติของลักษณะเฉพาะที่จะนำมาใช้และสร้างกราฟพฤติกรรมผู้ใช้โดยถูกสร้างขึ้นจากผู้วิจารณ์ (reviewer) เชื่อมต่อกับผู้วิจารณ์ (reviewer) ที่มีคุณสมบัติพฤติกรรมที่คล้ายกัน BeGP เป็นรูปแบบการเรียนรู้แบบกึ่งอาศัยข้อมูลฝึกสอน (semi-supervised learning) โดยเริ่มต้นด้วยกราฟย่อยขนาดเล็กที่มีผู้วิจารณที่เขียนความคิดเห็นเท็จถูกติดป้ายสแปมเมอร์ (spammer) หลังจากการคำนวณค่าจากคุณลักษณะในกราฟซ้ำๆ จากการสร้างการเชื่อมต่อผู้ใช้รายอื่นๆ จะสามารถแยกเป็นชุดสแปมเมอร์จากผู้ใช้งานทั่วไป (legimate user)ได้ ผู้วิจัยแสดงให้เห็นถึงประสิทธิภาพของ BeGP ในการทดสอบกับบทวิจารณ์จริงจำนวนสองชุด ที่ได้จากเว็บข้อมูล Yelp.com โดยผลที่ได้แสดงให้เห็นว่า BeGP เป็นวิธีที่ดีกว่าวิธีการที่มีอยู่ในปัจจุบัน โดยสามารถระบุสแปมเมอร์ และบทวิจารณ์ สแปมได้อย่างถูกต้อง ใน k ลำดับแรก ได้

Abstract

Online reviews, an important source of user opinions, help not only other customers to make a decision but also manufacturers to improve quality of their products or services. Due to commercial reasons, untruthful reviews (spam) written to promote or demote certain products rather than they deserve have become a crucial problem. Although existing supervised approaches have shown the effectiveness of spam detection by using statistical learning, they require much expensive cost for labeling the training data. In this thesis, we present BeGP that is a graph-partitioned approach for opinion spam detection. A set of characteristic features is first extracted, and a user behavioral graph is constructed by connecting reviewers sharing those features to capture their similar behavior. BeGP is a semi-supervised scheme without requiring any training. Hence, it starts with a small subgraph of labeled spammers and afterwards iteratively expands by conducting connected other users as a resulted set of suspects. We demonstrate the effectiveness of BeGP on two real-world review datasets from Yelp.com. The result shows that it outperforms several state-of-the-art methods with accurately identifying spammers as well as review spams within the k -first order of ranking.

คำสำคัญ (Keywords)

opinion spam; opinion spam detection; user behavioral graph
partition; semi-supervised learning; online reviews

เว็บไซต์โครงงาน
-

วีดีโอคลิปของโครงงาน
-

ที่เก็บเวอร์ชันซอร์สโค้ด

-


สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
ชญาดา จันมาค้อ (g5614550054)

แก้ไขครั้งสุดท้าย
เมื่อ Sept. 6, 2019, 10:52 a.m. โดย ชญาดา จันมาค้อ (g5614550054)

สถานะการอนุมัติ
รออนุมัติ