Step1 :質(zhì)控 Read Quality Control
#了解數(shù)據(jù),包括reads類(lèi)型贼邓、reads數(shù)量巡揍、read質(zhì)量主穗、GC含量温算、可能的污染和其他問(wèn)題
#然后決定是否對(duì)數(shù)據(jù)進(jìn)行去接頭扣草、去標(biāo)簽胆绊、過(guò)濾低質(zhì)量序列操作紊婉。
#軟件:
質(zhì)量控制:FastQC
數(shù)據(jù)清洗:Trimmomatic
Step2:組裝 Assembly
#測(cè)序軟件有很多參數(shù),這些參數(shù)會(huì)影響測(cè)序結(jié)果辑舷,其中關(guān)鍵參數(shù)是K值 3,基因組大小槽片,基因組測(cè)序深度何缓。
使用測(cè)序軟件組裝
Sspades
SOAP-denovo
MIRA
ALLPATHS
5、基因組評(píng)價(jià)
busco还栓、QUAST
6碌廓、基因組注釋
結(jié)構(gòu)注釋
功能注釋
--------------------------------------------------------------------------------------------------
參考鏈接、軟件教程和補(bǔ)充信息
1剩盒、參考鏈接
https://www.melbournebioinformatics.org.au/tutorials/tutorials/assembly/assembly-protocol/
2谷婆、軟件教程
fataqc安裝與使用
https://blog.csdn.net/boringfantasy/article/details/80612886
https://rtsf.natsci.msu.edu/genomics/tech-notes/fastqc-tutorial-and-faq/
Trimmomatic安裝與使用(Illumina平臺(tái)數(shù)據(jù)過(guò)濾工具)
http://www.reibang.com/p/a8935adebaae
http://www.reibang.com/p/bc3ad9379e3e?utm_campaign=hugo
3、補(bǔ)充信息
測(cè)序原理
(1)一代sanger測(cè)序原理
https://zhuanlan.zhihu.com/p/94183808
(2)二代Illumina測(cè)序原理
https://blog.csdn.net/u011262253/article/details/102525491
(2)二代Roche454測(cè)序原理
https://www.creative-biogene.com/blog/index.php/2017/02/02/the-next-generation-sequencing-platform-of-roche-454/
(3)三代SMRT測(cè)序原理
https://www.bilibili.com/video/av625217828
(3)一辽聊、二纪挎、三代技術(shù)原理與比較
https://blog.csdn.net/tanzuozhev/article/details/78499194
測(cè)序數(shù)據(jù)
(1)單端測(cè)序與雙端測(cè)序
https://blog.csdn.net/hanli1992/article/details/82982434
(2)關(guān)于數(shù)據(jù),質(zhì)控的意義
http://blog.sina.com.cn/s/blog_668c63770102v4f2.html
(3)數(shù)據(jù)格式
fasta :
fastaQ :最常用
SAM :
BAM :SAM的二進(jìn)制格式
四種格式.gz壓縮文件