Hisat2安裝及比對(duì)

Hisat2STAR是目前轉(zhuǎn)錄組分析過程中用來做比對(duì)的兩款主要工具,記得有一篇好像是2017年的文章專門比較了幾款轉(zhuǎn)錄組比對(duì)工具對(duì)結(jié)果的影響惧所,結(jié)論中認(rèn)為兩款軟件在實(shí)際使用過程中對(duì)結(jié)果影響及耗時(shí)區(qū)別不大锐锣,我認(rèn)為選一款就可以饲窿,之前總是用STAR,今天試一下Hisat2轧苫。

一光督、官網(wǎng)下載軟件及安裝

https://daehwankimlab.github.io/hisat2/

Download頁面阳距,可以看到Hisat2非常友好地提供了二進(jìn)制的程序及Index(比對(duì)時(shí)的索引文件),省去了后續(xù)的一些小麻煩结借。

下載完后unzip進(jìn)行解壓筐摘,一開始報(bào)錯(cuò):

原來依賴的libstdc++.so.6需要高版本的庫,我沒有root權(quán)限船老,更新的話會(huì)很麻煩咖熟,果斷降版本,下載的hisat2-2.1.0后柳畔,解壓馍管,嘗試了一下,安裝成功:

二薪韩、構(gòu)建索引Index

Hisat2STAR在比對(duì)時(shí)都需要索引文件确沸,對(duì)于人及小鼠及常用模式生物,Hisat2官網(wǎng)提供了相應(yīng)的索引文件俘陷,下載后就能用罗捎,對(duì)于非模式生物,需要自己建立索引文件拉盾。

區(qū)別于bowtie2的索引只有基因組序列信息桨菜,Hisat2建立索引時(shí),應(yīng)該把轉(zhuǎn)錄組信息加進(jìn)去捉偏,此外倒得,Hisat2還支持將SNP信息加入到索引中,這樣比對(duì)的時(shí)候就可以考慮SNP的情況,需要通過下面命令將SNP文件轉(zhuǎn)換成hisat2-build能使用的文件:

extract_snps.py snp142Common.txt >genome.snp

因?yàn)槲已芯康奈锓N還沒有集合SNP信息的文件夭禽,我只能建立涵蓋基因組+轉(zhuǎn)錄組的索引:

Hisat2提供兩個(gè)Python腳本將GTF文件轉(zhuǎn)換成hisat2-build能使用的文件,依次運(yùn)行下面三個(gè)命令:

extract_exons.py *.gtf > genome.exon

extract_splice_sites.py *.gtf > genome.ss

hisat2-build genome.fa -p 10 --ss genome.ss--exon genome.exon /path/to/genome_snp_tran

最終生成的8個(gè)*.ht是我們比對(duì)時(shí)需要的索引文件:

三屎暇、Hisat2比對(duì):

-x? 指定索引文件所在路徑及前綴

-p? 線程數(shù)

hisat2輸出文件為sam格式,sam文件格式比較大驻粟,通常會(huì)直接通過“|”傳輸給samtools轉(zhuǎn)為bam文件根悼,并對(duì)bam文件進(jìn)行sort排序,以便后面處理(此步驟通過生信技能樹-健明老師帖子進(jìn)行改進(jìn)蜀撑,在此致謝)挤巡。

四、結(jié)果

?????? 結(jié)果會(huì)生成bam文件酷麦,為二進(jìn)制格式矿卑,無法直接查看,可以導(dǎo)入IGV進(jìn)行可視化沃饶,一般后面結(jié)果沒有異常時(shí)母廷,我不會(huì)去用IGV去看看比對(duì)結(jié)果去轻黑。而比對(duì)過程中的日志結(jié)果需要我們記錄一下:

我的總體比對(duì)率是73.19%,是比較低的琴昆,人的話得90%以上才認(rèn)為是比較好氓鄙,我的是非模式生物,目前也只能先接受這個(gè)結(jié)果了业舍,后面得想辦法再優(yōu)化抖拦。

參考

Kim, D., Paggi,J.M., Park, C.?et al.?Graph-based genome alignment andgenotyping with HISAT2 and HISAT-genotype.?Nat Biotechnol?37,907–915 (2019).?https://doi.org/10.1038/s41587-019-0201-4

http://www.360doc.com/content/21/0714/12/76149697_986501798.shtml

本文使用 文章同步助手 同步

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市舷暮,隨后出現(xiàn)的幾起案子态罪,更是在濱河造成了極大的恐慌,老刑警劉巖下面,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件复颈,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡沥割,警方通過查閱死者的電腦和手機(jī)券膀,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來驯遇,“玉大人芹彬,你說我怎么就攤上這事〔媛” “怎么了舒帮?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長陡叠。 經(jīng)常有香客問我玩郊,道長,這世上最難降的妖魔是什么枉阵? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任译红,我火速辦了婚禮,結(jié)果婚禮上兴溜,老公的妹妹穿的比我還像新娘侦厚。我一直安慰自己,他們只是感情好拙徽,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布刨沦。 她就那樣靜靜地躺著,像睡著了一般膘怕。 火紅的嫁衣襯著肌膚如雪想诅。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音来破,去河邊找鬼篮灼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛徘禁,可吹牛的內(nèi)容都是我干的诅诱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼晌坤,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼逢艘!你這毒婦竟也來了旦袋?” 一聲冷哼從身側(cè)響起骤菠,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎疤孕,沒想到半個(gè)月后商乎,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡祭阀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年鹉戚,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片专控。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡抹凳,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出伦腐,到底是詐尸還是另有隱情赢底,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布柏蘑,位于F島的核電站幸冻,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏咳焚。R本人自食惡果不足惜洽损,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望革半。 院中可真熱鬧碑定,春花似錦、人聲如沸又官。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽赏胚。三九已至访娶,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間觉阅,已是汗流浹背崖疤。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國打工秘车, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人劫哼。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓叮趴,卻偏偏與公主長得像,于是被迫代替她去往敵國和親权烧。 傳聞我的和親對(duì)象是個(gè)殘疾皇子眯亦,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容