我與轉(zhuǎn)錄組的愛恨情仇
感謝豆豆和花花給我這個學(xué)習(xí)轉(zhuǎn)錄組的機(jī)會 比心南窗!
轉(zhuǎn)錄組我自己折騰了很多次参歹,但是每次都是半途而廢勾哩。從最早的轉(zhuǎn)錄組學(xué)習(xí)小組學(xué)習(xí)筆記開始學(xué)習(xí)和模仿(copy 代碼),到后來參加線下課及線上課褒繁,上游流程玩的可溜了亦鳞,可到后面分析就懵了。
在我之前的認(rèn)知里棒坏,轉(zhuǎn)錄組的上游分析只是跑跑軟件燕差,fastqc、multiqc坝冕、fastp徒探、trimmomatic、catadapter瞎懟一通喂窟,再到后面無參的用trinity测暗,有參的用各種mapping軟件不管三七二十一往上map,然后就懵逼了磨澡,撓撓頭不知道下一步該怎么做了碗啄。由于我研究生期間做的東西很多很雜,所以總是沒有時間和機(jī)會把整個流程靜下心來好好的走完一遍钱贯。
嗯挫掏,這次呢,就趁此機(jī)會好好學(xué)一下秩命,也順便做個記錄尉共。
什么是轉(zhuǎn)錄組呢
我們都知道,染色體上的DNA是決定一個物種的關(guān)鍵弃锐,就像古代的皇帝袄友,坐鎮(zhèn)中央(細(xì)胞核),由將士們(各種各樣的蛋白質(zhì))大殺四方霹菊【珧迹皇帝怎么調(diào)兵遣將支竹,如何調(diào)動各處的兵馬呢?皇帝決定要發(fā)號施令了鸠按,就召喚發(fā)令官(RNA聚合酶)草擬口諭礼搁,由傳令官(mRNA)帶著圣上口諭(所攜帶的遺傳信息)到兵馬行(核糖體)招兵買馬,然后集結(jié)軍隊征戰(zhàn)四方目尖。而我們測的轉(zhuǎn)錄組呢馒吴,就相當(dāng)于去把這個傳令官給它抓起來,由刑部(測序儀)嚴(yán)刑拷打(測序)瑟曲,讓他把口諭內(nèi)容翻譯成我們能懂的語言饮戳,看看皇帝到底發(fā)的什么命令,從而理解整個帝國是如何運(yùn)作的洞拨。
大概是這樣吧扯罐?歡迎小伙伴們一起來討論看看有沒有什么地方理解錯了。
提供一個非常短且有趣的文章給大家理解這一塊內(nèi)容(10.1038/nmeth.2735)~
分析轉(zhuǎn)錄組需要的資源
當(dāng)然是要在linux平臺啦烦衣,畢竟很多軟件都是在linux平臺下開發(fā)的歹河,這是繞不開的一道坎。我有個老師一直在追求如何在Windows下通過不需要任何命令的方式做生物信息學(xué)分析琉挖。我總覺得启泣,有那個找替代品和盜版軟件的倔強(qiáng)和時間,早就把linux學(xué)得很溜了示辈。
我常用的平臺:Ubuntu16.04
Ubuntu對新手比較友好寥茫,安裝起來方便,雖然基佬紫配色不太好看(懶得調(diào))矾麻,但是好用就成纱耻。
軟件:
質(zhì)控:看看測序的質(zhì)量如何及對質(zhì)量不好的序列進(jìn)行修正(去接頭啦,去除低質(zhì)量序列啦等等)
- FastQC
- multiQC
- FastP
- trimmomatic
- cutadapter
無參:沒有參考基因組的話那就直接轉(zhuǎn)錄組de novo拼接
- trinity
有參:有兩種险耀,一種是基于比對的弄喘,另一種是不需要比對的,各有千秋甩牺,要看自己想要什么了蘑志。
- STAR
- Hisat2
- Bowtie
- Bowtie2
- BWA
……(好吧我不知道了)
下游大概的流程應(yīng)該是富集分析、功能注釋之類的贬派。急但。?嗯搞乏,果然學(xué)藝不精波桩。。
下面提供兩份來自nature protocols的做RNA-seq的protocol:
- Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown
-
Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks
這邊多說一句请敦,tophat這個工具開發(fā)者已經(jīng)不建議使用了的镐躲,所以第二份僅供了解和參考思路储玫,實戰(zhàn)中就不要用了呀。
打完收工~