如何鑒定數(shù)據(jù)的建庫方式(鏈特異性或非鏈特異性)

來自SRA的轉(zhuǎn)錄組數(shù)據(jù)友驮,很多文章方法描述簡單,無法判斷是否為鏈特異性數(shù)據(jù)驾锰,導(dǎo)致在mapping和raw reads count時參數(shù)不知如何選擇卸留。所以在數(shù)據(jù)處理前明確其建庫方式尤為重要

什么是鏈特異性建庫

在RNA-Seq建庫的時候,第一步都是進行RNA到cDNA的反轉(zhuǎn)錄椭豫,在反轉(zhuǎn)錄以后耻瑟,普通的RNA-Seq就直接使用random primer進行第2條鏈合成,隨后加接頭捻悯。這樣構(gòu)建出來的RNA-Seq庫進行測序以后是分不清這個序列是來自于genome的那條鏈的匆赃,因為被測序的有可能是gene的foward strand也有可能是reverse strand。而鏈特異性的RNA-Seq建庫是通過一定的建庫策略今缚,讓RNA在反轉(zhuǎn)錄和加adapter的過程以后還能夠保存鏈的信息的建庫策略算柳。
那么鏈特異性RNA-Seq的優(yōu)勢在于哪里呢?是在于它能夠處理一些gene overlap比較復(fù)雜的情況姓言。我們都知道瞬项,幾乎所有高等生物的gene在genome中的分布都是非均勻的,而且一般都是沒有鏈的偏好性何荚。
如果是普通的RNA-Seq囱淋,是分不清這些overlap區(qū)域的reads到底來自于哪一個gene,這就給定表達量帶來了非常大的麻煩餐塘。但是鏈特異性的RNA-Seq就不會妥衣,如果只是foward strand的gene表達那么reads就只會mapping到對應(yīng)的鏈上。
所以戒傻,用鏈特異性的建庫方法税手,是能夠更加準(zhǔn)確進行g(shù)ene定量的。
至于鏈特異性建庫的劣勢需纳,大概有2點吧:1個是貴芦倒,1個是操作復(fù)雜對于珍貴樣品(比如人體組織樣品)一旦建庫不成功就game over了。

如何判斷數(shù)據(jù)的建庫方式

判斷轉(zhuǎn)錄組數(shù)據(jù)是否為鏈特異性不翩,可以用RSeQC的infer_experiment.py工具兵扬。
該軟件的輸入數(shù)據(jù)為bam文件及bed12文件,bam文件很好得到口蝠,但是對于bed12文件確實要下一些功夫了器钟。該文件可以應(yīng)用UCSC的gtfToGenePre工具獲取,具體代碼如下:

#安裝gtfToGenePre
conda install -c bioconda ucsc-gtftogenepred
#從gtf轉(zhuǎn)換為GenePred格式
gtfToGenePred -genePredExt -geneNameAsName2 ../../reference/homo/Homo_sapiens.GRCh38.104.gtf gene.tmp
#從GenePred文件提取信息得到bed12文件
awk '{print $2"\t"$4"\t"$5"\t"$1"\t0\t"$3"\t"$6"\t"$7"\t0\t"$8"\t"$9"\t"$10}' gene.tmp >  genes_refseq.bed12

得到bed12文件即可使用infer_experiment.py判斷數(shù)據(jù)是否為鏈特異性亚皂。

#檢驗
infer_experiment.py -r genes_refseq.bed12 -i 2-mapping/SRR14760842.bam
 
##結(jié)果
This is PairEnd Data
Fraction of reads failed to determine: 0.1151
Fraction of reads explained by "1++,1--,2+-,2-+": 0.4451
Fraction of reads explained by "1+-,1-+,2++,2--": 0.4398

這個結(jié)果怎么看呢俱箱?
其實很簡單,就是要看這里灭必!



如果兩種的比例接近1:1則是非鏈特異性狞谱,如果兩者比例懸殊,則是鏈特異性禁漓。
舉個例子:



上圖這就是鏈特異性的單端數(shù)據(jù)

上圖這種就是非鏈特異性的單端數(shù)據(jù)

對于雙端測序則有些復(fù)雜:



上圖這種顯然是鏈特異性跟衅,而且是fr-secondstrand。意思就是read1在+鏈播歼,相對的gene也同樣在+鏈上伶跷,而read2在+鏈,相對的gene在-鏈上秘狞。這種就是kallisto中的--fr-stranded和stringtie中的--fr叭莫。



上圖這種雖是鏈特異性,但是是“fr-firststrand”烁试,也就是參數(shù)中的--rf雇初。

上圖這種兩種都在0.5附近且比例接近1:1,是非鏈特異性的雙端測序

結(jié)合上述例子减响,很顯然鑒定結(jié)果很明確靖诗,我的數(shù)據(jù)是一個雙端、非鏈特異性的數(shù)據(jù)支示,快檢驗一下你的數(shù)據(jù)吧刊橘!

參考

  1. RSeQC判斷鏈特異性(strand-specific)

  2. 如何判斷數(shù)據(jù)為鏈特異性轉(zhuǎn)錄組數(shù)據(jù)

  3. Reference gene model in bed format

  4. RSeQC使用筆記

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市颂鸿,隨后出現(xiàn)的幾起案子促绵,更是在濱河造成了極大的恐慌,老刑警劉巖嘴纺,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件败晴,死亡現(xiàn)場離奇詭異,居然都是意外死亡颖医,警方通過查閱死者的電腦和手機位衩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來熔萧,“玉大人糖驴,你說我怎么就攤上這事》鹬拢” “怎么了贮缕?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長俺榆。 經(jīng)常有香客問我感昼,道長,這世上最難降的妖魔是什么罐脊? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任定嗓,我火速辦了婚禮蜕琴,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘宵溅。我一直安慰自己凌简,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布恃逻。 她就那樣靜靜地躺著雏搂,像睡著了一般。 火紅的嫁衣襯著肌膚如雪寇损。 梳的紋絲不亂的頭發(fā)上凸郑,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音矛市,去河邊找鬼芙沥。 笑死,一個胖子當(dāng)著我的面吹牛尘盼,可吹牛的內(nèi)容都是我干的憨愉。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼卿捎,長吁一口氣:“原來是場噩夢啊……” “哼配紫!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起午阵,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤躺孝,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后底桂,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體植袍,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年籽懦,在試婚紗的時候發(fā)現(xiàn)自己被綠了于个。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡暮顺,死狀恐怖厅篓,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情捶码,我是刑警寧澤羽氮,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站惫恼,受9級特大地震影響档押,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一令宿、第九天 我趴在偏房一處隱蔽的房頂上張望叼耙。 院中可真熱鬧,春花似錦掀淘、人聲如沸旬蟋。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至冕碟,卻和暖如春拦惋,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背安寺。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工厕妖, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人挑庶。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓言秸,卻偏偏與公主長得像,于是被迫代替她去往敵國和親迎捺。 傳聞我的和親對象是個殘疾皇子举畸,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容