IGV-基因組瀏覽器-改造記錄(五)

寫在前面

IGV是目前廣泛使用的基因組瀏覽器谈跛。但在前述的推文中央拖,我們已經(jīng)提到過,其并沒有較多我們做小RNA數(shù)據(jù)分析或可視化所需的特性惦界。為此,我們已經(jīng)介紹了四處我們課題組對(duì)IGV修改咙冗。我的意思是沾歪,我們做了的IGV特性增強(qiáng),遠(yuǎn)遠(yuǎn)不止于此雾消。
今天抽空灾搏,擺出一個(gè)非常簡單,卻非常有用的特性立润。

小RNA測序數(shù)據(jù)特征

小RNA狂窑,長度往往在30bp以下。十年前的讀長桑腮,足以一次將小RNA成熟體測通泉哈。換言之,我們得到的都是sRNA全長轉(zhuǎn)錄本。高度重復(fù)是小RNA數(shù)據(jù)固有特征丛晦。除去較多重復(fù)區(qū)域產(chǎn)生的sRNA奕纫,剩余的sRNA仍然在數(shù)據(jù)中表現(xiàn)出高豐度。有可能烫沙,在10M數(shù)據(jù)中匹层,某個(gè)micro RNA的豐度是1M+。

小RNA數(shù)據(jù)快速分析邏輯與不足

基于這一數(shù)據(jù)特征锌蓄,我們進(jìn)行miRNA或者phasiRNA挖掘等分析時(shí)又固,我們常常會(huì)先進(jìn)行數(shù)據(jù)的collaspe,大體是煤率,如果一個(gè)sRNA的豐度是1000仰冠,那么我們會(huì)合并這個(gè)reads,并記錄為

>id-1000
CGATCGATCAGTGTTGGTTTT

隨后再進(jìn)行讀段回帖和下游分析蝶糯。這是一個(gè)非常機(jī)智的做法洋只,

  1. 因?yàn)閷?duì)于一套“高重復(fù)”的數(shù)據(jù),直接比對(duì)昼捍,我們需要處理10M個(gè)reads的比對(duì)识虚,而collaspe之后,我們只需要處理可能只有10K個(gè)reads的比對(duì)妒茬。(截圖不全担锤,時(shí)間數(shù)倍,對(duì)于更高深度乍钻,如目前最建議的30M肛循,那么會(huì)有更明顯的時(shí)間縮短)


  2. collapsed之后,數(shù)據(jù)將占用更少的硬盤银择,比對(duì)結(jié)果文件同樣減少許多多糠。(數(shù)據(jù)量較少,對(duì)于更高深度浩考,如目前最建議的30M夹孔,那么會(huì)有更明顯的硬盤空間節(jié)省)


一切看起來都沒有問題析孽,但當(dāng)我們想要在IGV上展示時(shí)搭伤,我們會(huì)發(fā)現(xiàn),問題出現(xiàn)了袜瞬。collasped的reads比對(duì)到genome的bam怜俐,無法在IGV上正常顯示出reads的豐度。
如下吞滞,



可以看到Collasped之后佑菩,看到的覆蓋率盾沫,事實(shí)上是uniqreads的數(shù)目,從左側(cè)殿漠,40+赴精,而實(shí)際數(shù)據(jù)應(yīng)該是 1700+。錯(cuò)誤的展示覆蓋率绞幌,會(huì)影響我們做真實(shí)的判斷蕾哟。

改造IGV使其實(shí)時(shí)解析.collasped.fa.bam

解決這個(gè)問題,其實(shí)一樣比較簡單莲蜘,我們可以改造IGV(而事實(shí)上谭确,我們已經(jīng)在之前的版本支持了,只是沒有推文)票渠。改造之后逐哈,我們可以直接在IGV導(dǎo)入collasped之后的bam文件,同時(shí)可以得到實(shí)際數(shù)據(jù)應(yīng)該有的覆蓋率问顷。



不止于此昂秃!為了加速IGV,事實(shí)上杜窄,我們需要使用其downsample的特性肠骆,然而,使用這一特性意味著塞耕,低豐度的reads會(huì)被忽略蚀腿,如左圖missing部分。我們可以看到 扫外,當(dāng)我們進(jìn)行實(shí)時(shí)解析mc.fa的時(shí)候莉钙,就沒有這種問題。因?yàn)槲覀冃枰睦L圖時(shí)間畏浆。


修改版IGV的獲取方式

近日有多個(gè)朋友聯(lián)系過來胆胰,想要使用這個(gè)改造后的IGV。嗯...
我個(gè)人的想法是:

  1. 付費(fèi)刻获,如資助XiaLab課題組出游一次写半,大體價(jià)格是3K褐望,那么將獲得本年度(如果還有更細(xì)的話)的我經(jīng)手的IGV更新功能。
  2. 直接聯(lián)系課題組PI即RX獲取抛寝,課題組主頁為 http://xialab.scau.edu.cn/

寫在最后

這兩天氧枣,總還是有傷感沐兵。或許只有做一些事情便监,會(huì)感到平靜一些扎谎。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末碳想,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子毁靶,更是在濱河造成了極大的恐慌胧奔,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,123評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件预吆,死亡現(xiàn)場離奇詭異龙填,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)拐叉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門岩遗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人凤瘦,你說我怎么就攤上這事宿礁。” “怎么了蔬芥?”我有些...
    開封第一講書人閱讀 156,723評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵梆靖,是天一觀的道長。 經(jīng)常有香客問我坝茎,道長涤姊,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,357評(píng)論 1 283
  • 正文 為了忘掉前任嗤放,我火速辦了婚禮思喊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘次酌。我一直安慰自己恨课,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,412評(píng)論 5 384
  • 文/花漫 我一把揭開白布岳服。 她就那樣靜靜地躺著剂公,像睡著了一般。 火紅的嫁衣襯著肌膚如雪吊宋。 梳的紋絲不亂的頭發(fā)上纲辽,一...
    開封第一講書人閱讀 49,760評(píng)論 1 289
  • 那天,我揣著相機(jī)與錄音璃搜,去河邊找鬼拖吼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛这吻,可吹牛的內(nèi)容都是我干的吊档。 我是一名探鬼主播,決...
    沈念sama閱讀 38,904評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼唾糯,長吁一口氣:“原來是場噩夢啊……” “哼怠硼!你這毒婦竟也來了鬼贱?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,672評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤香璃,失蹤者是張志新(化名)和其女友劉穎这难,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體增显,經(jīng)...
    沈念sama閱讀 44,118評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡雁佳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,456評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了同云。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片糖权。...
    茶點(diǎn)故事閱讀 38,599評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖炸站,靈堂內(nèi)的尸體忽然破棺而出星澳,到底是詐尸還是另有隱情,我是刑警寧澤旱易,帶...
    沈念sama閱讀 34,264評(píng)論 4 328
  • 正文 年R本政府宣布禁偎,位于F島的核電站,受9級(jí)特大地震影響阀坏,放射性物質(zhì)發(fā)生泄漏如暖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,857評(píng)論 3 312
  • 文/蒙蒙 一忌堂、第九天 我趴在偏房一處隱蔽的房頂上張望盒至。 院中可真熱鬧,春花似錦士修、人聲如沸枷遂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽酒唉。三九已至,卻和暖如春沸移,著一層夾襖步出監(jiān)牢的瞬間痪伦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評(píng)論 1 264
  • 我被黑心中介騙來泰國打工雹锣, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留流妻,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,286評(píng)論 2 360
  • 正文 我出身青樓笆制,卻偏偏與公主長得像,于是被迫代替她去往敵國和親涣达。 傳聞我的和親對(duì)象是個(gè)殘疾皇子在辆,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,465評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容