1. 什么是reads
高通量測序平臺產(chǎn)生的序列成為reads
2. 什么是contig
拼接軟件基于reads之間的overlap區(qū)诸典,拼接獲得的序列稱為contig(重疊群)。
3. 什么是scaffold
基因de novo測序垃环,通過reads拼接獲得contigs后昂拂,通常還要構(gòu)建454 paired-end庫或者Illumina Mate-pair庫兼搏,以獲得一定大小片段(如3kb衙傀,6kb梢为,10kb,20kb)雙端序列弛针〉铮基于這些序列,可以確定一些contig直接的順序關(guān)系削茁,這些先后順序已知的contigs組成scaffold宙枷。
4. 什么是Contig N50
Reads拼接后會獲得一些不同長度的Contigs。將所有的Contig長度相加茧跋,能獲得一個Contig總長度慰丛。然后將所有的Contigs按照從長到短進行排序,如獲得Contig 1瘾杭,Contig 2诅病,Contig 3...………Contig 25。將Contig按照這個順序依次相加粥烁,當(dāng)相加的長度達(dá)到Contig總長度的一半時贤笆,最后一個加上的Contig長度即為Contig N50。舉例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig總長度*1/2時讨阻,Contig 4的長度即為Contig N50芥永。Contig N50可以作為基因組拼接的結(jié)果好壞的一個判斷標(biāo)準(zhǔn)。
5. 什么是Scaffold N50
Scaffold N50與Contig N50的定義類似变勇。Contigs拼接組裝獲得一些不同長度的Scaffolds恤左。將所有的Scaffold長度相加贴唇,能獲得一個Scaffold總長度搀绣。然后將所有的Scaffolds按照從長到短進行排序,如獲得Scaffold 1戳气,Scaffold 2链患,Scaffold 3...………Scaffold 25。將Scaffold按照這個順序依次相加瓶您,當(dāng)相加的長度達(dá)到Scaffold總長度的一半時麻捻,最后一個加上的Scaffold長度即為Scaffold N50。舉例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold總長度*1/2時呀袱,Scaffold 5的長度即為Scaffold N50贸毕。Scaffold N50可以作為基因組拼接的結(jié)果好壞的一個判斷標(biāo)準(zhǔn)。