รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
ปรัชญาดุษฎีบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2563

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคฤดูร้อน ปีการศึกษา 2562

ประเภทโครงงาน
วิทยานิพนธ์

ชื่อโครงงานภาษาไทย
เรื่องเฟรมเวิร์คสถาปัตยกรรมทะเลสาบข้อมูล เพื่อแก้ปัญหาดาต้าไซโลแบบมีโครงสร้าง

ชื่อโครงงานภาษาอังกฤษ
Data Lake Architecture Framework for Solving Structured Data Silo Problems

ผู้พัฒนา
5517550037 ศศิธร สุชัยยะ

อาจารย์ที่ปรึกษาหลัก
สมนึก คีรีโต

อาจารย์ที่ปรึกษาร่วม
-

บทคัดย่อ

งานวิจัยนี้มีวัตถุประสงค์เพื่อการออกแบบสถาปัตยกรรมทะเลสาบข้อมูลเพื่อแก้ไขปัญหาดาต้าไซโล โดยแบ่งวัตถุประสงค์ย่อยออกเป็น 1) เพื่อนำเสนอเฟรมเวิร์คที่เป็นกรอบแนวทางและขั้นตอนวิธี ในการบูรณาการฟังก์ชันงาน เพื่อแก้ไขปัญหาฟังก์ชันงานไซโลในองค์กร 2) เพื่อนำเสนอกระบวนการในการแก้ไขปัญหาย่อยที่มีสาเหตุมาจากดาต้าไซโล ในด้านความแตกต่างของข้อมูล ความไม่สอดคล้องของข้อมูล ข้อมูลซ้ำซ้อน และปัญหาปริมาณดาต้าไซโลที่เพิ่มขึ้นอย่างต่อเนื่องในองค์กร 3) เพื่อนำเสนอวิธีการหรือกระบวนการที่จะดึงข้อมูลจากหลายไซโลมาจัดเก็บลงในทะเลสาบข้อมูล และทำให้ข้อมูลจากทะเลสาบข้อมูลถูกนำไปใช้ในการบูรณาการข้อมูลแบบมุมมองเดียวสำหรับแต่ละรายการข้อมูล

ผลการวิจัยพบว่า สถาปัตยกรรมทะเลสาบข้อมูลเพื่อแก้ไขปัญหาดาต้าไซโลได้นำเสนอแนวทางและวิธีการบูรณาการฟังก์ชันงานและบูรณาการข้อมูล และมีเฟรมเวิร์คย่อยที่ออกแบบลงรายละเอียดการบูรณาการดาต้าไซโลบนทะเลสาบข้อมูล มีผลการประเมินจากผู้เชี่ยวชาญในภาพรวมของสถาปัตยกรรมที่ผู้วิจัยออกแบบเป็นคะแนนความเหมาะสมในระดับสูง หรือคะแนนรวม 3.975 จากคะแนนเต็ม 5 คะแนน

ผลการทำงานของโปรแกรมตามเฟรมเวิร์คย่อยที่ออกแบบลงรายละเอียดการบูรณาการดาต้าไซโลบนทะเลสาบข้อมูลสามารถลดความแตกต่างของข้อมูลและความไม่สอดคล้องของข้อมูลได้ 100% ในกรณีที่ข้อมูลมีความหมายเหมือนกัน และสามารถลดความซ้ำซ้อนของข้อมูลทดสอบ ได้ 78.6%

Abstract

The objective of this research is to design data lake architecture framework for solving structured data silo problems by dividing into three sub-objectives, namely 1) to present a framework and guideline to solve the functional silo problems of organization, 2) to present processes that can solve data silo problems such as data differences, data inconsistency, data redundancy and the rising of data silos. 3) To present processes to extract data from many silos to be stored in the data lake, and then from the data lake to access data as a single view for each of them.

The results of the research found that data lake architecture framework for Solving structured data silo problems provides solutions and methods for functional integration and data integration. The framework provides details on how to integrate multiple data silos into the data lake. The evaluation results reflected from a group of architecture experts is 3.975  4.0 of 5 points

Case study of applying the purpose framework show decrease 100% data heterogeneity data and inconsistency problems in cases that the information have the same meaning. This architecture can reduce the redundancy of a test data set by 78.6%.

คำสำคัญ (Keywords)

Data Lake, Enterprise Architecture

เว็บไซต์โครงงาน
-

วีดีโอคลิปของโครงงาน
-

ที่เก็บเวอร์ชันซอร์สโค้ด

-


สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
ศศิธร สุชัยยะ (g5517550037)

แก้ไขครั้งสุดท้าย
เมื่อ Sept. 3, 2020, 3:30 p.m. โดย ศศิธร สุชัยยะ (g5517550037)

สถานะการอนุมัติ
รออนุมัติ