รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2562

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคฤดูร้อน ปีการศึกษา 2561

ประเภทโครงงาน
วิทยานิพนธ์

ชื่อโครงงานภาษาไทย
การเพิ่มประสิทธิภาพการจัดกลุ่มข้อมููลแอตทริบิลคลัสเตอร์ริ่ง

ชื่อโครงงานภาษาอังกฤษ
Entropy-Based Attribute Clustering

ผู้พัฒนา
5714550111 อดิศร ขมประเสริฐ

อาจารย์ที่ปรึกษาหลัก
ธนาวินท์ รักธรรมานนท์

อาจารย์ที่ปรึกษาร่วม
กฤษณะ ไวยมัย

บทคัดย่อ

ในปัจจุบัน Big Data มีความสำคัญสำหรับเรามากสำหรับชีวิตประจำวัน เพราะเรานำข้อมูลทุก ๆ อย่างเกิดขึ้นในชีวิตประจำวันเหล่านี้มาวิเคราะห์ เพื่อให้เกิดการเรียนรู้, จดจำ และพัฒนาความสามารถ ให้เกิดประสิทธิภาพมากที่สุด เช่น การนำข้อมูลกิจวัตประจำวันของการรับประทานอาหารมาวิเคราะห์ คุณค่าทางอาหาร, วิเคราะห์โปรแกรมอาหารให้เหมาะสมกับสภาพร่างกาย หรือนำมาวิเคราะห์พฤติกรรมประเภทอาหารที่ชอบทาน เป็นต้น ซึ่งการวิเคราะห์ข้อมูลดังกล่าวมีความซับซ้อน และขนาดของข้อมูลใหญ่ ส่งผลให้การนำข้อมูลมหาศาลเหล่านี้มาประมวลผล และวิเคราะห์ข้อมูลขนาดใหญ่ทำได้ยาก แต่ก็มีวิธีที่จะช่วยทำให้การวิเคราะห์ง่ายขึ้นโดยวิธีการจัดกลุ่มข้อมูลเพื่อนำมาวิเคราะห์ผลตามต้องการ และยังคงให้ข้อมูลที่ถูกต้อง ซึ่งวิธีการจัดกลุ่มข้อมูลนั้นเป็นเทคนิคการจัดกลุ่มที่สร้างผลลัพธ์ที่มีประสิทธิภาพ, ใช้ข้อมูลในการจัดเก็บน้อย และใช้เวลาในการวิเคราะห์ประมวลผลข้อมูลน้อย ตัวอย่างเช่น ชื่อหนังสือ, คำนำ ของหนังสือหนึ่งเล่ม สามารถบ่งบอกถึงเนื้อหาภายในของหนังสือเล่มนั้นได้

วิทยานิพนธ์นี้นำเสนอวิธีการปรับปรุงคุณภาพในการจัดกลุ่มแอตทริบิลคลัสเตอร์ริ่ง โดยใช้ MDL เป็นเกณฑ์ในการเลือกจัดกลุ่มแอตทริบิลคลัสเตอร์ ซึ่ง MDL มีคุณสมบัติในการใช้เป็นเกณฑ์ในการเลือกกลุ่มแอตทริบิลคลัสเตอร์โดยไม่ต้องใช้พารามิเตอร์ในการตั้งค่าเริ่มต้นเพื่อใช้ในการคำนวณเพื่อหาเกณฑ์ ในการเลือกแอตทริบิลคลัสเตอร์ที่ดีที่สุด(parameter-free)ซึ่งวิทยานิพนธ์นี้จะทำการทดลองผลจากการปรับปรุงอัลกอริทึมในการเลือกแอตทริบิลคลัสเตอร์กับดาต้าเซตจำนวน 23 ดาต้าเซตที่ถูกนำมาใช้ในการทดลองกันอย่างแพร่หลายทั่วไป ซึ่งจะแสดงให้เห็นผลการทดลองที่ได้ผลลัพธ์ของการประมวลผลข้อมูลที่เร็วขึ้น และยังให้คุณภาพของผลลัพธ์ที่ดีด้วย

Abstract

At present, Big Data is very important to us for everyday lifebecause we bring all the information that happens in these daily lives to analyze for learning, memorizing and developing abilities to be the most effective. Such as the introduction of daily activities about eating food to analyze nutritional value, analyze food programs to suit the physical condition or analyze the behavior eating food types etc.The analysis data as above mention were complex and large data size result in enormous data to process and analyzing large data is too difficult. Otherwise, there are ways to help make analysis easier by means of grouping data to analyze results as needed and still provide accurate information, there is method of grouping technique that produces effective results, uses less data to store and spend less time analyzing the data processing.For example, the title, introduction of a book can indicate the content of this book.

This thesis proposes a method to improve the quality of the clustering by using MDL as an alternative to the Attribute Cluster. MDL has the qualification to use contribute Cluster without the need to use default setting parameters to calculate criteria. In choosing the best Attribute Cluster, this thesis will experiment with the results of the algorithm optimization in selecting the Attribute Cluster with 23 datasets that are widely used in experiments and it will show the results of the experiment that results in faster data processing and also providing good quality results.

คำสำคัญ (Keywords)

attribute clustering; data summarization; minimum description
length;

เว็บไซต์โครงงาน
-

วีดีโอคลิปของโครงงาน
-

ที่เก็บเวอร์ชันซอร์สโค้ด

-


สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
อดิศร ขมประเสริฐ (g5714550111)

แก้ไขครั้งสุดท้าย
เมื่อ Sept. 10, 2019, 1:25 p.m. โดย อดิศร ขมประเสริฐ (g5714550111)

สถานะการอนุมัติ
รออนุมัติ