หลักสูตร/ปี พ.ศ. วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2562
ภาคและปีการศึกษาที่สำเร็จการศึกษา ภาคปลาย ปีการศึกษา 2561
ประเภทโครงงาน
โครงงานวิศวกรรม
ชื่อโครงงานภาษาไทย
การเปรียบเทียบเทคนิคการตรวจจับท่ารำวงมาตรฐาน
ชื่อโครงงานภาษาอังกฤษ
Comparison Thai dancing recognition techniques
ผู้พัฒนา
5810500421 ชญานิน ทองผาสุข
อาจารย์ที่ปรึกษาหลัก
จันทนา จันทราพรชัย
อาจารย์ที่ปรึกษาร่วม
-
บทคัดย่อ
การตรวจจับกิจกรรมท่าทางของมนุษย์มีการพัฒนาเทคนิคต่างๆ เพื่อการตรวจจับที่ดีที่สุด
ทางด้านชุดข้อมูลก็มีการพัฒนาให้มีความยืดหยุ่นมากขึ้น แต่กิจกรรมเฉพาะวัฒนธรรมไทยบางส่วนยังไม่สามารถตรวจจับได้ด้วยประสิทธิภาพสูงสุดจากเทคนิคที่พัฒนามาจากชุดข้อมูลต่างประเทศ จึงนำมาสู่การพัฒนารวบรวมชุดข้อมูลใหม่สำหรับกิจกรรมรำวงมาตรฐาน และนำเทคนิคการตรวจจับภาพเคลื่อนไหวมาเปรียบเทียบกัน เพื่อหาเทคนิคที่เหมาะสมที่สุดจาก 2 เทคนิคที่น่าสนใจ ได้แก่ 3D CNN และ LSTM ในการรวบรวมชุดข้อมูลท่ารำวงมาตรฐานถูกคัดมาใช้ในโครงงานนี้เพียง 5 ท่า ได้แก่ สอดสร้อยมาลา ชักแป้งผัดหน้า รำส่าย สอดสร้อยมาลาแปลง และรำยั่ว โดยสามารถรวบรวมชุดข้อมูลจากอาสาสมัครได้ 16 วิดีโอต่อคลาส ทั้งหมด 5 คลาสจาก 5 ท่ารำข้างต้น หลังจากนั้นจึงนำชุดข้อมูลมาใช้สร้างโมเดลจากแต่ละเทคนิคโดยกำหนดให้ batch size และ epoch เท่ากันที่ 16 และ 50 ตามลำดับ โดยแบ่งข้อมูลที่ใช้ในการเทรนและทดสอบโมเดลด้วยอัตราส่วน 7:3 โดยผลที่ได้พบว่าโมเดลที่พัฒนามาจากเทคนิค LSTM เหมาะสมกับการตรวจจับท่ารำวงมาตรฐานได้มากกว่า เนื่องจากมี accuracy เท่ากับ 0.1250 ในขณะที่โมเดลจากเทคนิค 3D CNN มีค่า accuracy เพียง 0.0800
Abstract
Human activities recognition has been developed using various techniques for optimal recognition and many datasets have also been developed for this task. However, some Thai culture activities cannot be recognized with the high performance by techniques developed by overseas datasets. That is the main motivation for collecting a new dataset about Thai dancing. We compare the performance between 2 interesting techniques, i.e. 3D CNN and LSTM. Only 5 classes from 16 volunteers are collected in this dataset. Then, two existing models from each technique are trained by the Thai dancing dataset with 16 batch size and 50 epochs using 7:3 to represent the ratio between the number of training data and test data. The final results show that LSTM model achieved 0.1250 accuracy which is better than 3D CNN obtaining the accuracy score of 0.0800.
คำสำคัญ (Keywords)
โครงข่ายประสาทเทียม
การตรวจจับท่าทาง
การจำแนกคลาสจากภาพเคลื่อนไหว
Neural Network
Activity recognition
Video classification
เว็บไซต์โครงงาน
-
ที่เก็บเวอร์ชันซอร์สโค้ด
-
ผู้นำเข้าข้อมูลครั้งแรก
ชญานิน
ทองผาสุข
(b5810500421)
แก้ไขครั้งสุดท้าย
เมื่อ May 29, 2019, 5:50 p.m. โดย
ชญานิน
ทองผาสุข
(b5810500421)
สถานะการอนุมัติ
อนุมัติแล้ว โดย
จันทนา
จันทราพรชัย
(fengcnc)
เมื่อ Sept. 19, 2019, 8:39 p.m.