HISAT: 一款快速的低內(nèi)存的基因組比對軟件

HISAT: 一款快速的低內(nèi)存的基因組比對軟件

HISAT是一個高效的RNA序列比對軟件斯嚎。HISAT使用了基于Burrows-Wheeler transform 和 the Ferragina-Manzini (FM) index的索引組合针饥,使用了兩種類型的索引:基于全基因組區(qū)域的FM索引和局部的FM索引淘这。與其他比對軟件相比袁梗,HISAT具有速度快鲁猩,準確率高等特點。HISAT支持不同長度的基因組序列岖沛,包括大于40億堿基基因組暑始。

HISAT算法設(shè)計

HISAT使用Bowtie2實現(xiàn)許多低一級的功能,比如FM index的構(gòu)建和查詢婴削。HISAT使用了兩種不同類型的索引:

  • 基于全局的FM 索引覆蓋全部的基因組
  • 眾多小的FM索引廊镜,每個索引覆蓋64000bp。

對于人基因組唉俗,HISAT創(chuàng)建了~4800個局部FM索引嗤朴,每個索引之間有1024bp的overlap,共覆蓋約三十一堿基虫溜。

? RNA-seq序列可能會跨越很大的區(qū)域(超過1M bp)雹姊。并且會跨越多個外顯子。HISAT將包含這種現(xiàn)象的reads分成了三種類型:

  1. long-anchored reads: 兩個外顯子至少比對上16bp.

  2. intermediate-anchored reads:有一個外顯子比對了8-15bp

  3. short-anchored reads: 有一個外顯子僅比對1-7bp

image-20191116135549116.png

全局FM索引對于short-anchored reads比對很困難衡楞,而局部FM index在比對這類reads時有很大優(yōu)勢吱雏。在將reads比對到一段較長的區(qū)域中時,HISAT可以使用局部索引比對剩余的區(qū)域寺酪,而不是使用全局索引坎背。

很多比對工具,大量的時間都消耗在這樣的short-anchored reads和intermediate-anchored reads上(30%~60%)寄雀,但是比對準確度或者成功率都不是很高,而HISAT在這一塊很有優(yōu)勢陨献。

與其他比對工具的速度和準確度比較

? HISAT盒犹,HISATx1, HISATx2分別使用了不同的參數(shù)。HISATx1使用one-pass方法眨业,HISATx2使用了two-pass方法急膀。模擬數(shù)據(jù)是100-bp rads,包含20 million挑reads龄捡。下圖是不同軟件每分鐘處理的reads數(shù)卓嫂。從圖上看,HISAT速度有明顯優(yōu)勢聘殖。

image-20191116145345034.png

? 檢測準確度方面晨雳,HISAT靈敏度達到了93%以上行瑞,而HISATx2更是達到了99%以上

image-20191116150602949.png

? 剪切位點精度方面,模擬數(shù)據(jù)包含87944個剪切位點餐禁,HISAT的靈敏度高達97.3%血久,并且精度也高達04.8%

image-20191116151054329.png

參考文獻:

  1. HISAT: a fast spliced aligner with low memory requirements
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市帮非,隨后出現(xiàn)的幾起案子氧吐,更是在濱河造成了極大的恐慌,老刑警劉巖末盔,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件筑舅,死亡現(xiàn)場離奇詭異,居然都是意外死亡陨舱,警方通過查閱死者的電腦和手機翠拣,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來隅忿,“玉大人心剥,你說我怎么就攤上這事”惩” “怎么了优烧?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長链峭。 經(jīng)常有香客問我畦娄,道長,這世上最難降的妖魔是什么弊仪? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任熙卡,我火速辦了婚禮,結(jié)果婚禮上励饵,老公的妹妹穿的比我還像新娘驳癌。我一直安慰自己,他們只是感情好役听,可當我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布颓鲜。 她就那樣靜靜地躺著,像睡著了一般典予。 火紅的嫁衣襯著肌膚如雪甜滨。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天瘤袖,我揣著相機與錄音衣摩,去河邊找鬼。 笑死捂敌,一個胖子當著我的面吹牛艾扮,可吹牛的內(nèi)容都是我干的既琴。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼栏渺,長吁一口氣:“原來是場噩夢啊……” “哼呛梆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起磕诊,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤填物,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后霎终,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體滞磺,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年莱褒,在試婚紗的時候發(fā)現(xiàn)自己被綠了击困。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡广凸,死狀恐怖阅茶,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情谅海,我是刑警寧澤脸哀,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站扭吁,受9級特大地震影響撞蜂,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜侥袜,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一蝌诡、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧枫吧,春花似錦浦旱、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至尼酿,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間植影,已是汗流浹背裳擎。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留思币,地道東北人鹿响。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓羡微,卻偏偏與公主長得像,于是被迫代替她去往敵國和親惶我。 傳聞我的和親對象是個殘疾皇子妈倔,可洞房花燭夜當晚...
    茶點故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容