1.什么是Reads?
高通量測(cè)序平臺(tái)產(chǎn)生的序列就稱為reads夜涕。
2.什么是Contig?
拼接軟件基于reads之間的overlap區(qū)属愤,拼接獲得的序列稱為Contig(重疊群)女器。
3.什么是Scaffold?
基因組de novo測(cè)序住诸,通過(guò)reads拼接獲得Contigs后驾胆,往往還需要構(gòu)建454 Paired-end庫(kù)或Illumina Mate-pair庫(kù)涣澡,以獲得一定大小片段(如3Kb、6Kb丧诺、10Kb入桂、20Kb)兩端的序列〔笛郑基于這些序列抗愁,可以確定一些Contig之間的順序關(guān)系,這些先后順序已知的Contigs組成Scaffold呵晚。
Contig N50:Reads拼接后會(huì)獲得一些不同長(zhǎng)度的Contigs.將所有的Contig長(zhǎng)度相加,能獲得一個(gè)Contig總長(zhǎng)度.然后將所有的Contigs按照從長(zhǎng)到短進(jìn)行排序,如獲得Contig 1,Contig 2,contig 3...………Contig 25.將Contig按照這個(gè)順序依次相加,當(dāng)相加的長(zhǎng)度達(dá)到Contig總長(zhǎng)度的一半時(shí),最后一個(gè)加上的Contig長(zhǎng)度即為Contig N50.舉例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig總長(zhǎng)度*1/2時(shí),Contig 4的長(zhǎng)度即為Contig N50.ContigN50可以作為基因組拼接的結(jié)果好壞的一個(gè)判斷標(biāo)準(zhǔn).
Scaffold N50:Scaffold N50與Contig N50的定義類似.Contigs拼接組裝獲得一些不同長(zhǎng)度的Scaffolds.將所有的Scaffold長(zhǎng)度相加,能獲得一個(gè)Scaffold總長(zhǎng)度.然后將所有的Scaffolds
按照從長(zhǎng)到短進(jìn)行排序,如獲得Scaffold 1,Scaffold 2,Scaffold 3...………Scaffold 25.將Scaffold按照這個(gè)順序依次相加,當(dāng)相加的長(zhǎng)度達(dá)到Scaffold總長(zhǎng)度的一半時(shí),最后一個(gè)加上
的Scaffold長(zhǎng)度即為Scaffold N50.舉例:Scaffold 1+Scaffold 2+ Scaffold3 +Scaffold 4 +Scaffold 5=Scaffold總長(zhǎng)度*1/2時(shí),Scaffold 5的長(zhǎng)度即為Scaffold N50.Scaffold N50可以作為基因組拼接
的結(jié)果好壞的一個(gè)判斷標(biāo)準(zhǔn).