หลักสูตร/ปี พ.ศ. วิศวกรรมศาสตรบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2567
ภาคและปีการศึกษาที่สำเร็จการศึกษา ภาคปลาย ปีการศึกษา 2566
ประเภทโครงงาน
โครงงานวิศวกรรม
ชื่อโครงงานภาษาไทย
ระบบ AI ตรวจจับและตัดคำหยาบจากเสียงและข้อความ
ชื่อโครงงานภาษาอังกฤษ
AI system for detecting and censoring offensive words in audio and text content
ผู้พัฒนา
6310503600 นางสาวอภิญญา สุทธิโสภาอาภรณ์
อาจารย์ที่ปรึกษาหลัก
พีรวัฒน์ วัฒนพงศ์
อาจารย์ที่ปรึกษาร่วม
-
บทคัดย่อ
ด้วยการเข้าถึงสื่อออนไลน์ที่ง่ายดายและรวดเร็วในปัจจุบัน ผู้คนจำนวนมากรวมไปถึงเด็ก เผชิญกับเนื้อหาที่ประกอบไปด้วยคำพูดไม่เหมาะสม โครงการระบบปัญญาประดิษฐ์ (AI) ตรวจจับและตัดคำหยาบจากเสียงและข้อความจึงถูกพัฒนาขึ้นเพื่อแก้ปัญหานี้ โดยมุ่งเน้นการใช้ภาษาธรรมชาติในการวิเคราะห์และกรองคำหยาบหรือคำไม่เหมาะสมออก ช่วยให้สื่อออนไลน์เหมาะสมสำหรับผู้ใช้งานทุกเพศทุกวัย
โครงการนี้เปรียบเทียบโมเดล 3 ตัว ได้แก่ Dense Neural Network, LSTM และ BiLSTM เพื่อหาโมเดลที่มีประสิทธิภาพสูงสุดสำหรับใช้งานจริง ผลการวิจัยพบว่า BiLSTM มีประสิทธิภาพสูงสุด โดยมีความแม่นยำ 99.70% บนชุดข้อมูล Train Set และ 85.55% บน Test Set อย่างไรก็ตาม โมเดลอาจทำนายผิดพลาดในบางบริบท เนื่องมาจากข้อมูลที่ใช้เทรนยังมีความหลากหลายไม่มากพอ
Abstract
The ease of accessing online content today exposes people, including children, to potentially offensive language. This project tackles this challenge by creating an Artificial Intelligence (AI) system that detects and removes offensive words from both spoken and written communication. The system focuses on using natural language processing techniques to analyze and filter out offensive words, making online media a safer and more inclusive space for everyone.
This project compared three different models - Dense Neural Network, LSTM, and BiLSTM - to find the most effective one for real-world use. The results showed that BiLSTM performed the best, with an accuracy of 99.70% on the training data and 85.55% on the testing data. However, the model sometimes made mistakes, likely because the training data it learned from was not varied enough.
คำสำคัญ (Keywords)
ปัญญาประดิษฐ์, ภาษาธรรมชาติ, การกรองคำหยาบ, BiLSTM, สื่อออนไลน์
เว็บไซต์โครงงาน
-
วีดีโอคลิปของโครงงาน
-
ที่เก็บเวอร์ชันซอร์สโค้ด
https://github.com/Emmyyyyyyy/TextAudioOffenseDetect.git
ผู้นำเข้าข้อมูลครั้งแรก
นางสาวอภิญญา
สุทธิโสภาอาภรณ์
(b6310503600)
แก้ไขครั้งสุดท้าย
เมื่อ March 25, 2024, 11:55 a.m. โดย
นางสาวอภิญญา
สุทธิโสภาอาภรณ์
(b6310503600)
สถานะการอนุมัติ
รออนุมัติ