Hisat2 | 又要搞事情了~ 在Window / MacOS下跑回帖轉(zhuǎn)錄組數(shù)據(jù) ~

寫在前面

故事一

最近,帶著一個師弟搞合作課題追城,期間發(fā)現(xiàn)刹碾,基因結(jié)構(gòu)注釋矯正非常重要。錯誤的基因結(jié)構(gòu)注釋會引發(fā)錯誤的判斷漓柑,從而甚至錯失一些課題故事亮點(diǎn)教硫。(當(dāng)然,我們有我之前寫的IGV-sRNA和IGV-GSAme辆布,分分鐘搞定)瞬矩。很久很久以前,我基于IGV源碼個性化開發(fā)了IGV-GSAme锋玲,目的就是快速矯正基因結(jié)構(gòu)注釋景用,更或者一邊挖生物學(xué)故事,一邊矯正基因結(jié)構(gòu)注釋惭蹂。開展這一部分工作的前提是依賴轉(zhuǎn)錄組測序數(shù)據(jù)回帖文件伞插,就是SAM/BAM
可以說盾碗,這是我一直不爽的事情媚污,難道不能讓所有人都可以自己回帖,自己矯正數(shù)據(jù)嗎廷雅?

故事二

前面耗美,調(diào)用 Kallisto京髓,我已經(jīng)搞定了RNAseq數(shù)據(jù)分析,從測序原始數(shù)據(jù)(甚至是SRA)文件到表達(dá)量以及Read Counts 的界面化商架,所有人堰怨,只要用的是 Windows 或 MacOS 系統(tǒng),都可以輕松完成蛇摸。再借助 TBtools 老鐵用戶們貢獻(xiàn)的 R Plugins备图,可以說,差異表達(dá)分析赶袄,富集分析揽涮,也全了。我自認(rèn)為弃鸦,幾乎完美绞吁!
但這個仍舊美中不足,為什么唬格?因?yàn)?Kallisto 只是真mapping家破,而“假”比對。無論怎么說购岗,他的準(zhǔn)確程度嚴(yán)重依賴與基因結(jié)構(gòu)注釋汰聋。換句話說,盡管趨勢沒啥問題喊积,數(shù)值偏差不大烹困,但偏差并不會消失。要盡可能準(zhǔn)確乾吻,還是得Align髓梅,而不是 Quant。

一切一切绎签,讓我很不爽枯饿!搞個基因結(jié)構(gòu)注釋矯正,就那么難诡必?不能讓所有人都搞得了嗎奢方?

當(dāng)然不是!

“山重水復(fù)疑無路爸舒,生信分析 TBtools蟋字!”,花了一點(diǎn)點(diǎn)時間扭勉,先搞了第一步鹊奖,Hisat2-build,即索引構(gòu)建涂炎。
我們很清楚嫉入,對于轉(zhuǎn)錄組回帖軟件來說焰盗,索引構(gòu)建總是比回帖時需要占用的內(nèi)存大得多。只要能構(gòu)建索引(或者下載到別人構(gòu)建好的索引)咒林,那就可以回帖。
于是爷光,TBtools 又增加了一個插件5婢骸(本帖預(yù)告)
在Windows下,4G內(nèi)存的PC蛀序,測試索引構(gòu)建欢瞪,完美!



在MacOS下徐裸,VMware虛擬機(jī)遣鼓,4G內(nèi)存,測試香蕉基因組的索引構(gòu)建重贺,完美骑祟!



大概花了 15 min。
怎么說呢气笙?這里有一個 Trick 的地方次企。索引構(gòu)建其實(shí)可以通過插入剪切位點(diǎn)位置和外顯子位置,搞得需要非常高的內(nèi)存潜圃,以至于人類基因組就需要上百G缸棵。但這類索引則一般更適合在成熟的物種上,比如模式生物谭期。這就有趣了堵第,因?yàn)槟J缴锏腍isat index,直接去官網(wǎng)下載構(gòu)建好的就行了隧出。對于非模式生物踏志,其實(shí)已知注釋本來就不準(zhǔn),那么插入就幾乎不存在意義鸳劳。常規(guī)模式挺好~
于是狰贯,剩下的就是下一步,Hisat-align ~

寫在后面

假期更是忙碌赏廓,
那么這個車開不開涵紊?車票定多少合適呢?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末幔摸,一起剝皮案震驚了整個濱河市摸柄,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌既忆,老刑警劉巖驱负,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件嗦玖,死亡現(xiàn)場離奇詭異,居然都是意外死亡跃脊,警方通過查閱死者的電腦和手機(jī)宇挫,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來酪术,“玉大人器瘪,你說我怎么就攤上這事』嫜悖” “怎么了橡疼?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長庐舟。 經(jīng)常有香客問我欣除,道長,這世上最難降的妖魔是什么挪略? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任历帚,我火速辦了婚禮,結(jié)果婚禮上瘟檩,老公的妹妹穿的比我還像新娘抹缕。我一直安慰自己,他們只是感情好墨辛,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布卓研。 她就那樣靜靜地躺著,像睡著了一般睹簇。 火紅的嫁衣襯著肌膚如雪奏赘。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天太惠,我揣著相機(jī)與錄音磨淌,去河邊找鬼。 笑死凿渊,一個胖子當(dāng)著我的面吹牛梁只,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播埃脏,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼搪锣,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了彩掐?” 一聲冷哼從身側(cè)響起构舟,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎堵幽,沒想到半個月后狗超,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體弹澎,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年努咐,在試婚紗的時候發(fā)現(xiàn)自己被綠了苦蒿。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡麦撵,死狀恐怖刽肠,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情免胃,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布惫撰,位于F島的核電站羔沙,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏厨钻。R本人自食惡果不足惜扼雏,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望夯膀。 院中可真熱鬧诗充,春花似錦、人聲如沸诱建。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽俺猿。三九已至茎匠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間押袍,已是汗流浹背诵冒。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留谊惭,地道東北人汽馋。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像圈盔,于是被迫代替她去往敵國和親豹芯。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容