รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2561

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคปลาย ปีการศึกษา 2560

ประเภทโครงงาน
โครงงานวิศวกรรม

ชื่อโครงงานภาษาไทย
การระบุลักษณะผู้ใช้ทวิตเตอร์จากการวิเคราะห์ข้อมูลโทโพโลยี

ชื่อโครงงานภาษาอังกฤษ
Characterizing Twitter Users from Topological Data Analysis

ผู้พัฒนา
5710503410 ปราชญ์ปรียา กิตติสารพงษ์

อาจารย์ที่ปรึกษาหลัก
บัณฑิต มนัสเกษมศักดิ์

อาจารย์ที่ปรึกษาร่วม
อานนท์ รุ่งสว่าง

บทคัดย่อ

สังคมออนไลน์ในปัจจุบันที่มีผู้ใช้งานมากมายมาพร้อมกับความหลากหลาย ก่อให้เกิดเป็นสังคมของผู้ใช้โซเชียลมีเดียโดย ทวิตเตอร์(Twitter) เป็นหนึ่งในโซเชียลมีเดียที่มีผู้ใช้งานที่มีการเคลื่อนไหวของบัญชีเฉลี่ยมากถึง 328 ล้านบัญชีต่อเดือน จึงมีการส่งข้อมูลไหลเวียนจำนวนมากในทวิตเตอร์ โดยเฉลี่ยข้อมูลการทวีต(Tweet) 500 ล้านทวีตต่อวัน
ในการศึกษานี้ได้ทำการวิเคราะห์คุณลักษณะหรือรูปร่างสังคมทวิตเตอร์ตัวอย่าง เพื่อนำไปพัฒนาระบบแนะนำโฆษณา รวมถึงอีเว้นท์ต่างๆ จากการวิเคราะห์ความสัมพันธ์ของสังคมที่มีลักษณะหลากมิติ(High-Dimentions) ในรูปแบบการสร้างรูปทรง(Shape) เพื่อมุมมองที่กว้างขึ้น
จุดมุ่งหมายในงานวิจัยนี้คือการศึกษาคุณลักษณะของสังคมทวิตเตอร์โดยทดสอบการใช้ความรู้ด้านโทโพโลยี(Topology) และความรู้ด้านการวิเคราะห์ข้อมูลโดยกระบวนการทางโทโพโลยี(Topology Data Analysis) มาใช้ในการอธิบายปัจจัยที่ทำให้มีผลต่อความสนใจของผู้ใช้ในสื่อสังคมออนไลน์นั้นๆ โดยขั้นตอนแรกจะพยายามหาสิ่งที่เป็นตัวแปรสำคัญในการบ่งบอกความสนใจในแต่ละคน ซึ่งในที่นี้เราเลือกแฮชแท็กมาทำหน้าที่ในการแยกสิ่งที่ผู้ใช้ทวีตแฮชแท็กถึงสิ่งที่ตนสนใจอยู่ โดยคำนวณจากการหาอันดับแฮชแท็กที่ผู้คนพูดถึงมากที่สุด แล้วไปเทียบหาคะแนนความสัมพันธ์กับแฮชแท็กแต่ละทวีต เพื่อนำข้อมูลคะแนนที่ได้เหล่านั้นมาสร้างโทโพโลยี และวิเคราะห์โครงสร้างความสนใจของสังคมได้ชัดเจนมากขึ้น เราหวังว่าโครงงานชิ้นนี้จะเป็นประโยชน์ให้แก่ผู้สนใจศึกษาการวิเคราะห์ข้อมูลด้วยโทโพโลยี หรือการวิเคราะห์คุณลักษณะความสนใจในสังคมทวิตเตอร์ ให้สามารถเข้าถึงผู้คน และเลือกกลุ่มคนที่สนใจในสิ่งที่เฉพาะทางได้ดียิ่งขึ้น

Abstract

Nowadays, there are many online users coming with various activities, so that this causes several large online social media. Twitter is an example of online social application that serves active user 328 million accounts per month on average, associated with data flows over 500 million tweets per day
This project analyzes characteristics (shape of topology) of Twitter’s social in order to suggestion system from relationships of High-dimensions data of Twitter’s social. The purpose of this research is to study the characteristics of social tweets by testing topology and topological data analysis to describe the factors that affect the interests of users in social media. The first step is to find out the key variables of each person's interest. We chose a number of most frequent that people talk about as features of training data for TDA. Then, we compare all hashtags of each tweets with the list of most frequent hashtags to calculate relationship scores to create a preprocessing data and create topologies. We analyze the structure of socialize interest from the topology that we got. We hope this project will helpful if you interested in studying data analysis with topology or Twitter. We can understand people’s interests better.

คำสำคัญ (Keywords)

Topology, Topology data analysis, Twitter

เว็บไซต์โครงงาน
-

วีดีโอคลิปของโครงงาน

ที่เก็บเวอร์ชันซอร์สโค้ด

-


สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
ปราชญ์ปรียา กิตติสารพงษ์ (b5710503410)

แก้ไขครั้งสุดท้าย
เมื่อ June 14, 2018, 7:18 a.m. โดย ปราชญ์ปรียา กิตติสารพงษ์ (b5710503410)

สถานะการอนุมัติ
รออนุมัติ