RNA-seq分析隐锭,參考基因組的選擇其實也是有學問的窃躲,這是個容易被忽略的問題。
例子:
小鼠RNAseq
首先钦睡,獲取小鼠基因組序列蒂窒,一般基因組數(shù)據(jù)庫有:
UCSC的genome data
NCBI的Genomes
Ensembl
但是,需要注意的是赎婚,不管哪一個數(shù)據(jù)庫刘绣,關于小鼠基因組序列,除了很熟悉的組裝的染色體序列(例如挣输,UCSC纬凤,chrN.fa);還有一些序列撩嚼,現(xiàn)在只是知道它屬于那一條染色體停士,并不能在染色體上定位(例如,UCSC完丽,chrN_random.fa)恋技;這還不算完,全基因組測序從來都不是個簡單的事情逻族,總有一些序列(例如蜻底,UCSC,chrUn_random.fa)你測不完整以及測完了也并不一定可以正確的找到他屬于那一條染色體聘鳞。
隨便想一下就知道薄辅,基因組如此之多堿基對,其根本組成無非就那幾個抠璃;生物進化過程中站楚,各種染色體結構變異使得堿基序列各種變化。
現(xiàn)在進去正題搏嗡,我們需要想一下窿春,那我們參考基因組怎么選擇拉一?
兩個方案:
1)組裝的染色體序列+線粒體DNA序列,植物還得加上葉綠體DNA序列旧乞,整合成基因組參考序列蔚润。
有問題來了,RNAseq是整個細胞的RNA尺栖,屬于無法正確在染色體定位和無法定位到特定染色體的reads就出事故了抽碌,要么丟了,要么匹配到染色體其它位置了决瞳。咋辦货徙?
不用著急。首先大家可以看一下皮胡,其實我們丟掉的那部分序列相對于我們組裝的染色體來講是相當小了痴颊;后面,mapping結果還可以根據(jù)reads的mapping qulity和read count數(shù)量濾掉匹配不好的reads屡贺。這兒蠢棱,reads的過濾,根據(jù)自己實際情況設定閾值甩栈。
2)所有序列組合在一起組成基因組參考序列泻仙,放在一起分析,比較省事量没,后面根據(jù)分析想要那部分結果玉转,自己忽略其它的結果就萬事大吉。
好啦殴蹄,說幾句官話究抓。分析時還得根據(jù)自己實際情況具體分析,比如mapping qulity的設定袭灯,不需要特別高刺下,要知道RNAseq是反轉錄的數(shù)據(jù),不可能沒錯誤的稽荧;并且選擇基因組參考序列時橘茉,要知道你要干嘛?哦姨丈,只是想對基因或者外顯子表達定量畅卓,還是想發(fā)現(xiàn)新的轉錄本之類的。說這么多构挤,還是直接上手吧髓介。
RNA-seq選擇參考基因組
最后編輯于 :
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
- 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來申眼,“玉大人瞒津,你說我怎么就攤上這事±ㄊ” “怎么了巷蚪?”我有些...
- 正文 為了忘掉前任淌喻,我火速辦了婚禮,結果婚禮上雀摘,老公的妹妹穿的比我還像新娘裸删。我一直安慰自己,他們只是感情好阵赠,可當我...
- 文/花漫 我一把揭開白布烁落。 她就那樣靜靜地躺著,像睡著了一般豌注。 火紅的嫁衣襯著肌膚如雪伤塌。 梳的紋絲不亂的頭發(fā)上,一...
- 文/蒼蘭香墨 我猛地睜開眼童本,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了脸候?” 一聲冷哼從身側響起穷娱,我...
- 正文 年R本政府宣布,位于F島的核電站瘦黑,受9級特大地震影響京革,放射性物質發(fā)生泄漏。R本人自食惡果不足惜幸斥,卻給世界環(huán)境...
- 文/蒙蒙 一匹摇、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧甲葬,春花似錦廊勃、人聲如沸。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至画侣,卻和暖如春冰悠,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背配乱。 一陣腳步聲響...
推薦閱讀更多精彩內容
- 作為一個已經在生物信息行業(yè)摸爬兩年的小白,還是有必要重新認識一下高通量測序領域的一些常用名詞燥透。什么是高通量測序沙咏?高...
- 什么是高通量測序辨图? 高通量測序技術(High-throughput sequencing,HTS)是對傳統(tǒng)Sang...
- 非常優(yōu)秀的研究總結芭碍,值得學習領會和思考。因為字數(shù)太多孽尽,可以去作者的博文地址http://www.huangshuj...