Pengertian Metagenomik. proses sampling DNA, Teknologi sequencing, dan Anotasi Gen

Metagenomik merupakan analisis genetika secara langsung dari suatu genom sampel. Metagenomik memberikan akses kepada gen fungsional dan deskripsi filogenetik yang lebih luas. Dengan sendirinya, metagenomic akan memberikan inromasi mengenai biokatalis atau enzim baru, hubungan genomic antara fungsi dan filogeni serta profil evolusi dari fungsi dan struktur. Dalam proses eksperimennya, terdapat serangkaian tahapan dari mulai proses sampling, teknik sequencing, pengumpulan data, binning, dan annotasi. Tahapan tersebut juga perlu disusun melalui desain eksperimen dan analisis statistic yang sesuai.

Proses sampling merupakan salah satu tahap paling krusial dari projek metagenomik manapun. DNA yang diekstrak haruslah representatif dari semua sell yang ada dan harus diperoleh asam nukleat dengan kualitas dan kuantitas yang mencukupi untuk proses pengarsipan dan sequencing. Perlu diperhatikan juga hubungan antara organisme sampel dengan inangnya. Materi genetik inang dapat menyaingi jumlah organisme target seperti virus. Tahapan fraksinasi diperlukan pada tahap ini untuk memeroleh sampel yang baik. Beberapa contoh metode yang dapat digunakan adalah filtrasi selektif, sentrifugasi bertahap, dan flow cytometry. Pemisahan dan isolasi sel secara fisik dari sampel juga penting untuk memaksimalkan persen hasil ataupun untuk menghindari koekstrasi inhibitor enzimatik yang dapat mengganggu keberlangsungan proses sampling.

Beberapa tipe sample sering kali menghasilkan persen hasil DNA yang sangat rendah. Pembuatan pembukuan untuk kebanyakan teknologi sekuensing membutuhkan DNA dalam jumlah yang besar sehingga proses amplifikasi dari material awal perlu untuk dilakukan. Multiple Displacement Amplification (MDA) menggunakan heksamer acak dan faga phi29 polimerase menjadi salah satu opsi yang digunakan untuk meningkatkan persen hasil DNA. Metode tersebut dapat mengamplifikasi DNA dalam jumlah femtogram untuk memproduksi microgram produk dan hal tersebut telah digunakan secara luas pada genomik sel tunggal dan metagenomik.Pada berbagai macam metode amplifikasi terdapat permasalahan potensial behubungan dengan kontaminasi reagen, pembentukan kimera, dan bias sekuens pada tahapan amplifikasi yang dampaknya bergantung pada jumlah dan tipe material awal dan banyaknya siklus amplifikasi yang diperlukan, Teknologi shotgun sequence telah mulai beralih dari sanger sequencing menuju next-generation sequencing (NGS). Teknologi ini masih dianggap sebagai standar untuk sequencing karena galat yang rendah, jarak baca yang panjang (>700) dan ukuran insert yang besar. Kekurangan dari metode sanger adalah cloning proses yang membutuhkan tenaga yang besar dan biaya USD 400.000 per gb. Di antara teknlogi NGS, sistem 454/Roche dan Illumina/Solexa telah secara ekstensif diaplikasikan pada sampel metagenomic. Sistem 454/Roche mengaplikasikan emultion polymerase chain reaction (ePCR) untuk mengamplikasi fragmen acak DNA secara klonal. Proses firosekuens melibatkan tahapat penambahan ke empat basa nukleotida, yang bila secara komplemen akan berikatan dengan DNA. Proses polimerasi akan melepaskan firofosfat yang kemudian akan dikonversi melalui dua reaksi enzimatik untuk memproduksi cahaya. ~1.2 juta reaksi dideteksi secara parallel melalui sebuah kamere charge-coupled device (CCD) dan dikonversikan menjadi sekuens sesungguhnya.Salah satu keuntungan dari sistem ini adalah biayanya yang sebesar USD 20.000 per gb.

Teknologi Illumina/Solexa mengimobilisasi fragmen DNA acak pada permukaan dan kemudian melakukan amplifikasi pada permukaan padat PCR, yang menghasilkan kelompok fragmen DNA identik. Fragmen tersebut kemudian diurutkan dengan terminator reversibel dalam proses sequencing-by-sintesis. Kepadatan cluster sangat besar, dengan ratusan juta pembacaan per saluran permukaan dan 16 saluran yang dijalankan pada instrumen HiSeq2000. Panjang baca mendekati 150 bp. Informasi urutan kontinu sebesar 300 bp dapat diperoleh dari dua sekuens tumpang tindih sebesar 150 bp dari satu insert. Oleh karena itu, hasil ~ 60 Gbp biasanya dapat dihasilkan dalam satu saluran. Illumina / Solexa kekurangan, beberapa set dapat menunjukkan tingkat kesalahan tinggi di ujung sekuens. Biaya yang rendah (~ USD50 per Gbp) serta keberhasilan aplikasinya pada metagenomik dan perancangan genom dari dataset yang kompleks, saat ini membuat teknologi Illumina menjadi pilihan yang semakin populer.

Beberapa teknologi pengurutan tambahan tersedia yang mungkin terbukti berguna untuk aplikasi metagenomik, sekarang atau dalam waktu dekat masa depan. Sequencer Applied Biosystems SOLiD telah banyak digunakan, misalnya, dalam resequencing genom. SOLiD bisa dibilang menyediakan galat terendah dari teknologi sekuensing NGS saat ini, namun pembacaan tidak melebihi 50 nukleotida.

Reference-based assembly dapat dilakukan menggunakan program Newbler (Roche), AMOS http://sour-ceforge.net/projects/amos/, atau MIRA. Program tersebut memiliki algoritma yang cepat dan memiliki efesiensi memori yang kemudian dapat dijalnkan pada computer berukuran laptop pada beberapa jam. Reference-based assembly akan bekerja secara baik bila data set sekuens metagenomic memiliki referensi genome kerabat yang telah diketahui. Namun, akan terjadi perbedaan antara genome sample dengan referensi akibat adanya insersi, delesi ataupun polimorfisme. Penyusun de novo berbasis grafik de Bruijn secara spesifik dibuat untuk menghadapi data dalam ukuran yang sangat besar. Mesin yang dibutuhkan untuk menjalankan de Bruijn assemblers, Velvet atau SOAP berbeda secara signifikan karena dalam sekali menjalankan analisis dibutuhkan memori yang sangat besar dan waktu berhari-hari. Binning merupakan proses pemilihan sekuens DNA ke dalam kelompok yang mungkin merepresentasikan genome individual dari organisme yang berkerabat dekat. Pertama, Binning komposisional akan menggunakan prinsip bawa terdapat bagian dari genome yang lestari, sepertu GC atau kelimpahan distribusi k-mers tertentu. Kedua, fragmen DNA yang belum diketahui fungsinya namun kemungkinan mengkodekan suatu gen dan terdapat gen dengan kesamaan yang telah diketahui sebagai referensinya dapat digunakan untuk proses klasifikasi. Algoritma komputasi binning berbasis komposisional termasuk Phylopythia, S-GSOM, PCAHIER dan TACAO, sedangkan perangkat lunak dengan algoritma binning berbasis similaritas termasuk IMG/M, MG-RAST, MEGAN, CARMA, SOrt-ITEMS dan MetaPhyler. Terdapat pula program dengan kedua alogritma seperti PhymmBL dan MetaCluster.

Annotasi dapat dilakukan melalui dua jalur. Jalur pertama, jika rekonstruksi genom merupakan tujuan utama dan proses assembly mengasilkan contigs dengan ukuran besar, digunakan anotasi genom menggunakan program RAST atau IMG. Pendekatan ini akan berhasil jiga panjang contig minimum sebesar 30,000 bp atau lebih. Annotasi kedua dapat dilakukan pada keseluruhan komunitas dan bertumpu pada sekumpulan contig pendek yang belum tersusun. Secara umum, annotasi terdiri dari dua tahap, yaitu identifikasi fitur prediksi (Gen) dan yang kedua adalah fungsi dan taksonomi gen. Prediksi gen dapat melalui program FragGeneScan, MeraGeneMark, MetaGene dan Orphelia. Annotasi fungsi sangat lah sulit dilakukan. Saat ini hanya 20 hingga 50% sekuens metagenomic yang dapat diannotasikan. Sekuens yang tidak dapat di dannotasikan dengan pustaka yang tersedia disebut dengan ORFans. Untuk melalukan annotasi ORFans perlu dilakukan analisis homology melalui database. Terdapat database yang menyediakan konteks fungsional seperti KEGG, eggnog, COG/KOG, PFAM dan TIGRFAM. Namun database tersebut tidak mencakup semua fungsi biologis. MEGAN merupakan perangkat lain yang digunakan untuk memvisualisasikan hasil turunan pencarian BLAST fungsional ataupun dendogram taksonomi.

The Primer-E package merupakan perangkat yang memungkinkan analisis statistik multivariat termasuk dengan pembuatan plot multi-dimentional scaling (MDS), dan analisis kesamaan (ANOSIM) serta identifikasi fungsi spesies yang berkontribusi pada kedua sampel (SIMPER). Baru baru ini, multivariat statistic telah dimasukan ke dalam perangkat basis jaringan metastats. Secara ideal dan umum, desain eksperimen seharunya digerakkan oleh pertanyaan dan referensi sampel untuk komparasi data harus diambil dan diproses secara konsisten. Variasi data yang dihasilkan dapat terbentuk oleh variasi biologis alami atau karena variasi teknis dan hal tersebut perlu untuk dipertimbangkan pada tahap perencanaan. Sistem mikro sangatlah dinamis sehingga aspek temporal sangatlah penting untuk analisis dan interpretasi data. Replikasi data harus diperhatikan untuk menghindari kesalahan interpretasi. Jika tujuan penelitian adalah untuk mengetahui variasi dari habitat A, diperlukan pengambilan sampel dengan metode yang sama. Pengambilan satu sampel dan membagi-baginya hanya akan menghasilkan variasi teknis. Eksperimen metagenomik haruslah direncanakan dan interpretasi secara hati-hati.

Komentar

Rekomendasi

Tanya

Postingan populer dari blog ini

Struktur Sesorah Bahasa Jawa dan Contohnya

Cerita Singkat Legenda Danau Toba

Struktur Pidato Biantara Bahasa Sunda