(全文約900字)
1. HiFi數(shù)據(jù)
HiFi reads(High Fidelity reads)是2019年由PacBio公司推出的基于環(huán)化一致性序列(Circular Consensus Sequencing誊抛,CCS)模式產(chǎn)生的既兼顧長讀長(10-20kb的長度)又具有高精度(>99%準(zhǔn)確率)的測序結(jié)果列牺。非常適合用于基因組組裝。
- HiFi數(shù)據(jù)預(yù)處理
- 可以用
bam2fasta
直接把下機(jī)數(shù)據(jù)ccs.bam或者h(yuǎn)ifi.bam轉(zhuǎn)換成fasta格式文件用于后續(xù)分析拗窃。 -
bam2fasta sample.ccs.bam -c 9 -o sample.ccs
命令會生成sample.ccs.fasta.gz文件瞎领,-c 9
代表壓縮程度為9。
- 用HiFi數(shù)據(jù)組裝基因組的軟件選擇
- 2024年發(fā)表在Genome Research上的一篇文章 對11種針對HiFi測序技術(shù)的組裝工具的評估結(jié)果顯示随夸,hifiasm和hifiasm-meta分別是組裝真核基因組和宏基因組的最佳工具九默。
- 文章顯示,在真核生物基因組組裝中宾毒,hifiasm在不同方法比較的組裝基因組均具有更高的連續(xù)性驼修、完整性和準(zhǔn)確性;HiCanu诈铛、Verkko與LJA次之乙各,但Verkko與LJA具有組裝的contig較短等缺陷;NextDenovo僅對單倍體基因組具有更好的性能幢竹。
- 宏基因組組裝評估中耳峦,hifiasm-meta以及metaflye的組裝錯(cuò)誤最少,但是在面對復(fù)雜宏基因組時(shí)hifiasm-meta的完整性及連續(xù)性明顯優(yōu)于metaflye焕毫,但同時(shí)也會保留部分冗余的序列蹲坷。
目前來說驶乾,Hifiasm軟件是用HiFi數(shù)據(jù)組裝基因組的不二選擇。
2. Hifiasm軟件
- 簡介
- Hifiasm是一個(gè)利用PacBio HiFi數(shù)據(jù)進(jìn)行從頭組裝基因組冠句,獲得單倍體基因組的組裝工具轻掩。
- 由哈佛大學(xué)李恒團(tuán)隊(duì)在2021年2月份開發(fā),首次發(fā)表在Nature Methods上懦底。2022年在Nature biotechnology上發(fā)表論文,在Hifiasm中引入了Hi-C Integrated assembly 模式罕扎。
- Hifiasm被設(shè)計(jì)用于PacBio HiFi數(shù)據(jù)組裝基因組聚唐,使用在分型組裝圖(pahsed assembly graph)中表示單倍體信息的算法。
- 特點(diǎn)和優(yōu)勢
- 運(yùn)行速度很快腔召。半天時(shí)間可以組裝一個(gè)人類基因組杆查。
- 可以接受一種數(shù)據(jù)類群的多個(gè)輸入文件(如多個(gè)HiFi數(shù)據(jù)文件),并且合并作為一個(gè)文件輸入和多個(gè)文件輸入的結(jié)果不同臀蛛,建議就保持多個(gè)文件輸入亲桦。
- 傾向于盡量組裝更長的contigs。
- 能夠更好地解決片段重復(fù)(segmental duplications)
- 可以利用Hi-C數(shù)據(jù)或/和親本二代Illumina測序數(shù)據(jù)獲得解析良好的單倍型組裝浊仆。
- 也可以利用Oxford Nanopore數(shù)據(jù)獲得端粒到端粒的組裝客峭。
- Hifiasm簡化了組裝流程
- 內(nèi)置了清除haplotigs之間的重復(fù)(duplications)的程序,無需第三方工具(如purge_dups)抡柿。
- 組裝完成后無需polish工具(如pilon舔琅,racon)進(jìn)行polish。
3. references
- Hifiasm manual:https://hifiasm.readthedocs.io/_/downloads/en/latest/pdf/
- Hifiasm介紹:https://www.bilibili.com/read/cv18775152/
- hifiasm組裝(多個(gè)cell的HiFi輸入文件)的不同結(jié)果:https://mdnice.com/writing/25f5a8fe3bfe4474ae1bdcab44604da9
- 歡迎關(guān)注微信公眾號:生信技工
- 公眾號主要分享生信分析洲劣、生信軟件备蚓、基因組學(xué)、轉(zhuǎn)錄組學(xué)囱稽、植物進(jìn)化郊尝、生物學(xué)概念等相關(guān)內(nèi)容,包括生物信息學(xué)工具的基本原理战惊、操作步驟和學(xué)習(xí)心得流昏。
<img src="https://upload-images.jianshu.io/upload_images/27301949-49e5f7e3cfa4f753.png" width=50% title="wechat_public_QRcode.png" align=center/>
本文由mdnice多平臺發(fā)布