寫在前面
高通量測序技術(shù)普及,大量物種基因組被測序锣光。組裝質(zhì)量逐步提高,但基因結(jié)構(gòu)注釋的質(zhì)量則一如既往的讓人擔(dān)心铝耻。錯誤的基因結(jié)構(gòu)注釋誊爹,可能會使得你得到錯誤的結(jié)果。比如:
- 不準(zhǔn)確的基因結(jié)構(gòu)注釋瓢捉,使得編碼蛋白集合序列有誤频丘,最終導(dǎo)致同義突變位點的錯誤統(tǒng)計,得到的Ks值有錯泡态,于是無法相對正確的估算物種的分化時間搂漠;
- 不準(zhǔn)確的基因結(jié)構(gòu)注釋,可能會使你得到的分析結(jié)果是某個基因家族的擴(kuò)張或者收縮某弦,而實際情況是桐汤,存在一定的基因沒有被正確注釋出來
- 不準(zhǔn)確的基因結(jié)構(gòu)注釋而克,在更嚴(yán)重的情況下,直接會導(dǎo)致你做的所有RNAseq定量出錯怔毛,于是你無論怎么分析员萍,得到的差異表達(dá)基因列表都毫無意義。
- 不準(zhǔn)確的基因結(jié)構(gòu)注釋拣度。碎绎。。
總的來說抗果,Garbage in, Garbage out.筋帖。
我一如既往地向各位提出,分析中需要注意的各種各樣的問題冤馏。而不是給出分析流程幕随,送出代碼。
我開始覺得宿接,很多人并不值得你去分享你的所做赘淮,所知∧丽或者是他們不需要梢卸,或者是他們不懂,或者是他們不屑副女。
可能只有聰明的人才知道蛤高,
成功是不能復(fù)制的,但是坑是可以躲過的碑幅。
你復(fù)現(xiàn)再多人的流程戴陡,能得到的往往是類似的結(jié)果。所以paste code
的工作沟涨,能讓你得到的永遠(yuǎn)是表面的恤批。
好,說好了不吐槽裹赴,然而我還是寫了一長串喜庞。
今天這個推文的主題是,推出剛才改造的IGV的新的使用姿勢棋返。
快速在全基因組查看[t]BlastN結(jié)果
Blast延都,我們大家都很熟悉。IGV睛竣,我們也很熟悉晰房。存在不少時候,我們會希望直接在IGV中可視化Blast的結(jié)果,這樣做的好處有很多殊者。
- 看看某個基因或者基因家族在IGV的分布位置与境,隨后結(jié)合RNAseq數(shù)據(jù)進(jìn)行人工基因結(jié)構(gòu)注釋矯正
- 看看某條引物可能的錯配位置...
- 看看其他物種的序列,在當(dāng)前物種中的位置幽污,結(jié)合RNAseq數(shù)據(jù)或者其他重測序數(shù)據(jù),比如你要看看再這里有沒有SNP
- ....【用途不應(yīng)該由我來想簿姨,而是用戶來想】
使用方式與效果
我一貫認(rèn)為距误,生物信息到下游,必然是要可視化Inspect扁位。在這種情況下准潭,超短時間內(nèi)獲得可用于可視化的數(shù)據(jù),有助于縮短你的分析時間域仇,更重要的是刑然,不會打斷你的分析思路。
blastn或者tblastn都可以暇务,感興趣的各位可以自己命令行操作泼掠。而我這里直接使用TBtools,因為這樣方便垦细。
所以操作步驟簡單:
- 設(shè)置輸入的序列择镇,比如一條蛋白序列
- 設(shè)置subject為基因組序列
- 設(shè)置輸出文件,注意確保輸出結(jié)果文件后綴為「.tabblastn」
- 點擊Start
很快你會得到輸出文件括改,直接從「File」菜單中導(dǎo)入「IGV」即可腻豌。
當(dāng)我們放大這些比對上的位置,可能會看到
可以看到嘱能,輸入序列比對到四個同一家族的成員吝梅,中間的那個,很有可能是錯誤注釋惹骂。
可視化基因結(jié)構(gòu)
比如我現(xiàn)在有一個CDS苏携,我可以直接比對到這個region,看看他的基因結(jié)構(gòu)对粪。
圖片中兜叨,我只做的三步操作:
- 點擊一下其中一個轉(zhuǎn)錄本的形狀,這是在IGV改造八中增加的特性衩侥,點擊一下国旷,直接在剪切板中獲得CDS序列,很多人為此抓狂
- 黏貼CDS序列到TBtools的Query Seq茫死,其他的不修改
- 點擊Start跪但,隨后載入IGV
我們可以看到,BlastN整體上復(fù)現(xiàn)了原來的基因結(jié)構(gòu),說明還是不錯屡久。
不過忆首,一切基于純粹的文本比較無法100%結(jié)構(gòu)正確,這個問題以前分享過被环。
寫在最后
洋洋灑灑糙及,又是一篇推文。IGV的設(shè)計是很不錯的筛欢〗牵可能IGV的代碼也是我看的第一份Java源碼,畢竟版姑,我當(dāng)初是因為從零寫了兩個基因組瀏覽器柱搜,效果實在是不如IGV才來看他。我天真的以為IGV不會調(diào)用太多的第三方包剥险。然而事實正好相反聪蘸。可能這就是我個人思維的局限吧表制。
希望各位也明白健爬,很多時候,你不用自己厲害么介,你身邊的人厲害就可以了浑劳。
更或者,【是努力夭拌?還是機(jī)遇魔熏?讓你走的更高呢?】
這是一個開放的問題鸽扁,但是也是一個Closed的問題蒜绽。因為打開展開來說,只會有兩種結(jié)果:
- 雞湯
- 毒雞湯
那么就到這里桶现,祝各位明日開工大吉躲雅。