หลักสูตร/ปี พ.ศ. วิทยาศาสตรมหาบัณฑิต สาขาวิชาเทคโนโลยีสารสนเทศ ปี พ.ศ. 2567
ภาคและปีการศึกษาที่สำเร็จการศึกษา ภาคต้น ปีการศึกษา 2566
ประเภทโครงงาน
การศึกษาค้นคว้าอิสระ
ชื่อโครงงานภาษาไทย
การประยุกต์ใช้ความเปลี่ยนแปลงของข้อมูลเพื่อสุ่มลดข้อมูลสำหรับการแก้ปัญหาการจัดประเภทข้อมูลที่ไม่สมดุล
ชื่อโครงงานภาษาอังกฤษ
A Data Change Based Under-Sampling Approach for Solving Imbalanced Data Classification
ผู้พัฒนา
6314552222 นางสาววราพรรณ ธิยานันท์
อาจารย์ที่ปรึกษาหลัก
กฤษณะ ไวยมัย
อาจารย์ที่ปรึกษาร่วม
จันทนา จันทราพรชัย
บทคัดย่อ
ปัจจัยที่สำคัญที่สุดอย่างหนึ่งในการพัฒนาความแม่นยำในการจำแนกประเภทโดยเทคนิคการเรียนรู้ของเครื่อง (Machine Learning) คือคุณภาพของข้อมูลที่ใช้ในการเรียนรู้ อย่างไรก็ตามข้อมูลในโลกของความเป็นจริงโดยมากนั้นไม่สมดุล กล่าวคือข้อมูลส่วนใหญ่จัดอยู่ในกลุ่มข้อมูลหลัก (Majority Class) และส่วนน้อยจัดอยู่ในกลุ่มข้อมูลย่อย (Minority Class) บทความนี้นำเสนอแนวทางสำหรับการสุ่มลดข้อมูลของกลุ่มข้อมูลตัวอย่างโดยการคงไว้เฉพาะตัวแทนของกลุ่มข้อมูลนั้น ความเปลี่ยนแปลงของข้อมูลมาจากการใช้เทคนิคในการเลือกข้อมูลโดยมีเป้าหมายเพื่อลดกลุ่มข้อมูลหลักให้มีขนาดเล็กลง ผลการศึกษาแสดงให้เห็นว่ากลไกการเลือกข้อมูลจากความเปลี่ยนแปลงของข้อมูลสามารถเพิ่มความแม่นยำของข้อมูลกลุ่มย่อยได้ทั้งเทคนิคการสุ่มลดข้อมูล (Under-Sampling) และเทคนิคการสุ่มแบบผสม (Mixed Sampling)
Abstract
One of the most important factors for improving the accuracy of machine learning classification techniques is the quality of the training data. However, real-world data are mostly imbalanced, that is, most of the data are in majority class and little data are in minority class. This paper introduces an approach for under-sampling samples of the majority class by keeping only its representative data. A data change based selection technique is proposed to reduce the majority class data. The experimental results show that our data change based selection mechanism is able to improve the accuracy of the minority class for both under sampling and mixed sampling techniques.
คำสำคัญ (Keywords)
Data Change, Imbalanced Data, Decision Tree, Machine Learning
เว็บไซต์โครงงาน
-
วีดีโอคลิปของโครงงาน
-
ที่เก็บเวอร์ชันซอร์สโค้ด
-
ผู้นำเข้าข้อมูลครั้งแรก
นางสาววราพรรณ
ธิยานันท์
(g6314552222)
แก้ไขครั้งสุดท้าย
เมื่อ Aug. 14, 2024, 4:26 p.m. โดย
นางสาววราพรรณ
ธิยานันท์
(g6314552222)
สถานะการอนุมัติ
อนุมัติแล้ว โดย
กฤษณะ
ไวยมัย
(fengknw)
เมื่อ Aug. 14, 2024, 4:49 p.m.