รายละเอียดโครงงาน

หลักสูตร/ปี พ.ศ.
วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ปี พ.ศ. 2552

ภาคและปีการศึกษาที่สำเร็จการศึกษา
ภาคปลาย ปีการศึกษา 2551

ประเภทโครงงาน
วิทยานิพนธ์

ชื่อโครงงานภาษาไทย
การจำแนกซับแฟมิลีและวิเคราะห์โครงสร้างของเอนไซม์ด้วยวิธีการพิจารณาการติดกันของคู่ลำดับกรดอะมิโนและโพรไฟล์ฮิดเด้นมาร์คอฟโมเดล

ชื่อโครงงานภาษาอังกฤษ
Enzyme Subfamily Classification and Structure Analysis Using Residue Contact and Profile HMMs

ผู้พัฒนา
48654065 สิริวรรณ แต้วิจิตร

อาจารย์ที่ปรึกษาหลัก
กฤษณะ ไวยมัย

อาจารย์ที่ปรึกษาร่วม
-

บทคัดย่อ

การค้นพบเอนไซม์ใหม่มีอัตราการค้นพบที่สูงขึ้นอย่างรวดเร็ว เพื่อลดเวลาและค่าใช้จ่ายในการจำแนกประเภทเอนไซม์ จึงมีการพัฒนางานวิจัยเพื่อสร้างระบบอัตโนมัติด้วยวิธีการต่างๆได้แก่ (1) วิธีการเปรียบเทียบเอนไซม์ใหม่และเอนไซม์ต้นแบบที่ทราบฟังก์ชั่นแล้ว วิธีดังกล่าวให้ความถูกต้องสูงเมื่อเอนไซม์ใหม่มีค่าความเหมือนกับเอนไซม์ต้นแบบมากกว่า 60% (2) วิธีการพิจารณาส่วนย่อยของลำดับกรดอะมิโน ซึ่งสามารถบ่งบอกฟังก์ชั่นได้ (3) วิธีการสร้างฟีเจอร์เพื่อเป็นตัวแทนเอนไซม์ เช่นพิจารณาความถี่ในการเกิดกรดอะมิโน วิธีดังกล่าวให้ความถูกต้องได้ดีแต่กระนั้นผลลัพธ์ที่ได้ไม่สามารถแสดงความสัมพันธ์เกี่ยวกับโครงสร้างของเอนไซม์ใหม่ได้
ในงานวิจัยนี้ทำการพัฒนาระบบจำแนกประเภทเอนไซม์ซับแฟมิลีที่ให้ความถูกต้องสูง และให้ผลลัพธ์ที่สามารถนำไปวิเคราะห์โครงสร้างเอนไซม์ใหม่ ในรูปแบบการติดกันของโครงสร้างทุติยภูมิ โดยมีสมมติฐานที่ว่าส่วนย่อยของโครงสร้างเอนไซม์สามารถบ่งบอกหน้าที่การทำงานของเอนไซม์ได้ สำหรับส่วนย่อยของโครงสร้างนั้นสืบค้นจากตารางเมตริกซ์คอนแทคแมป ซึ่งเป็นการแปลงข้อมูลโครงสร้าง 3 มิติให้อยู่ในรูปตารางเมตริกซ์ที่เข้าใจง่าย และนำแต่ละส่วนย่อยมาประกอบกันเป็นตัวแทนสายโปรตีนด้วยโพรไฟล์ฮิดเด้นมาร์คอฟโมเดล ดังนั้นข้อมูลที่ใช้ในการสกัดฟีเจอร์จำเป็นต้องทราบโครงสร้าง 3 มิติแล้วเท่านั้น คิดเป็นสัดส่วนเพียง 11.21%ของข้อมูลทั้งหมดในงานวิจัยนี้ และสร้างแบบจำลองด้วยซัพพอร์ตเวคเตอร์แมชชีน จากผลการทดลองพบว่าฟีเจอร์จากตารางเมตริกซ์คอนแทคแมป มีความสัมพันธ์และมีนัยสำคัญเพียงพอในการจำแนกประเภทเอนไซม์ โดยแบบจำลองให้ค่าความถูกต้องถึง 73.71% เมื่อทดสอบด้วยวิธี jackknife และเมื่อเพิ่มองค์ความรู้เกี่ยวกับการแทนที่ระหว่างกรดอะมิโน สามารถเพิ่มความถูกต้องได้ถึง 75.87% เมื่อทดสอบด้วยวิธี 10-fold cross validation

Abstract

The number of enzyme sequence grows exponentially over time. Identifying of class
for a new found enzyme is usually performed by experiments in laboratory. Unfortunately, it is both time-consuming and costly. Large number of researches on enzyme classification have been carried out for decade such as (1) homology-based, this approach got hight accuracy when similarity score between target and template is more than 60%. (2) subsequence-based, this approach aims to find useful portions that related to enzyme function. (3) feature-based, this approach tries to represent enzyme with the new form. Their results were able to generate good accuracy but they cannot exhibit relationships between enzyme and its structure.
In this research, we propose an enzyme subfamily classification method using residue
contact and profile HMMs. Our hypothesis is based on the fact that enzyme function is directly related to its structure. First, each fragment from contact map matrix which is representative of 3D structure is extracted. Then, profile HMMs is used to build feature vector to represent each enzyme sequence. Notice that only enzymes with known PDB (11.21% of the trainning data) have been used to extract features. Finally, SVM was used to build a classifier. Our method yields high accuracy and provides structural description based on secondary structure contact on 3D domain. Empirical results show that our method yields 73.71% accuracy with jackknife test and the accuracy rises up to 75.87% when substitution group of amino acids is used for backround knowledge. These suggest that our feature extraction from contact map and Profile HMMs are sufficiently significant for enzyme subfamily classification.

คำสำคัญ (Keywords)

-

เว็บไซต์โครงงาน
-

วีดีโอคลิปของโครงงาน
-

ที่เก็บเวอร์ชันซอร์สโค้ด

-


สถานะการนำเข้าข้อมูล

ผู้นำเข้าข้อมูลครั้งแรก
พิทักษ์ นาคทรงแก้ว (fengptn)

แก้ไขครั้งสุดท้าย
เมื่อ Jan. 23, 2017, 9:28 a.m. โดย พิทักษ์ นาคทรงแก้ว (fengptn)

สถานะการอนุมัติ
รออนุมัติ