RNA-seq的counts值钱磅,RPM, RPKM, FPKM, TPM 的異同

RNA-seq的counts值魂奥,RPM, RPKM, FPKM, TPM 的異同

現(xiàn)在常用的基因定量方法包括:RPM, RPKM, FPKM, TPM终抽。這些表達(dá)量的主要區(qū)別是:通過不同的標(biāo)準(zhǔn)化方法為轉(zhuǎn)錄本豐度提供一個(gè)數(shù)值表示势木,以便于后續(xù)差異分析蛛倦。

標(biāo)準(zhǔn)化的主要目的是去除測(cè)序數(shù)據(jù)的技術(shù)偏差:測(cè)序深度和基因長度。

測(cè)序深度:同一條件下啦桌,測(cè)序深度越深溯壶,基因表達(dá)的read讀數(shù)越多。

基因長度:同一條件下甫男,不同的基因長度產(chǎn)生不對(duì)等的read讀數(shù)且改,基因越長,該基因的read讀數(shù)越高板驳。

Counts值

對(duì)給定的基因組參考區(qū)域又跛,計(jì)算比對(duì)上的read數(shù),又稱為raw count(RC)若治。

計(jì)數(shù)結(jié)果的差異的影響因素:落在參考區(qū)域上下限的read是否需要被統(tǒng)計(jì)慨蓝,按照什么樣的標(biāo)準(zhǔn)進(jìn)行統(tǒng)計(jì)。

RPM (Reads per million mapped reads)

image.png

RPM方法:10^6標(biāo)準(zhǔn)化了測(cè)序深度的影響端幼,但沒有考慮轉(zhuǎn)錄本的長度的影響礼烈。

RPM適合于產(chǎn)生的read讀數(shù)不受基因長度影響的測(cè)序方法,比如miRNA-seq測(cè)序婆跑,miRNA的長度一般在20-24個(gè)堿基之間此熬。

RPKM/FPKM (Reads/Fragments per kilo base per million mapped reads)

image.png

RPKM/FPKM方法:103標(biāo)準(zhǔn)化了基因長度的影響,106標(biāo)準(zhǔn)化了測(cè)序深度的影響。

FPKM方法與RPKM類似犀忱,主要針對(duì)雙末端RNA-seq實(shí)驗(yàn)的轉(zhuǎn)錄本定量募谎。在雙末端RNA-seq實(shí)驗(yàn)中,有左右兩個(gè)對(duì)應(yīng)的read來自相同的DNA片段峡碉。在進(jìn)行雙末端read進(jìn)行比對(duì)時(shí)近哟,來自同一DNA片段的高質(zhì)量的一對(duì)或單個(gè)read可以定位到參考序列上。為避免混淆或多次計(jì)數(shù)鲫寄,統(tǒng)計(jì)一對(duì)或單個(gè)read比對(duì)上的參考序列片段(Fragment)吉执,來計(jì)算FPKM,計(jì)算方法同RPKM地来。

RPKM/FPKM與RPM的區(qū)別:考慮了基因長度對(duì)read讀數(shù)的影響戳玫。

RPKM與FPKM的區(qū)別:RPKM值適用于單末端RNA-seq實(shí)驗(yàn)數(shù)據(jù),F(xiàn)PKM適用于雙末端RNA-seq測(cè)序數(shù)據(jù)未斑。

RPKM/FPKM適用于基因長度波動(dòng)較大的測(cè)序方法咕宿,如lncRNA-seq測(cè)序,lncRNA的長度在200-100000堿基不等蜡秽。

TPM (Transcript per million)

image.png

TPM的計(jì)算方法也同RPKM/FPKM類似府阀,首先使用式2計(jì)算每個(gè)基因的表達(dá)值,去除基因長度的影響芽突。隨后計(jì)算每個(gè)基因的表達(dá)量的百分比试浙,最后再乘以10^6,TPM可以看作是RPKM/FPKM值的百分比寞蚌。

http://www.bio-info-trainee.com/2017.html

相當(dāng)于重新標(biāo)準(zhǔn)化的文庫田巴,保證每個(gè)樣本中所有TPM的總和是相同的。

TPM與RPKM/FPKM的區(qū)別:從計(jì)算公式來說挟秤,唯一的不同是計(jì)算操作的順序壹哺,TPM是先去除了基因長度的影響,而RPKM/FPKM是先去除測(cè)序深度的影響艘刚,具體可看這篇博文管宵,有計(jì)算步驟的詳細(xì)說明;TPM實(shí)際上改進(jìn)了RPKM/FPKM方法在跨樣品間定量的不準(zhǔn)確性攀甚。

TPM的使用范圍與RPKM/FPKM相同啄糙。

總結(jié)

raw count作為原始的read計(jì)數(shù)矩陣是一個(gè)絕對(duì)值,而絕對(duì)值的特點(diǎn)是規(guī)模不同(基因長度云稚、測(cè)序深度)隧饼,不可以比較。進(jìn)行這些基因標(biāo)準(zhǔn)化方法的目的是將count矩陣轉(zhuǎn)變?yōu)橄鄬?duì)值静陈,去除技術(shù)偏差的影響燕雁,使后續(xù)的差異分析具有統(tǒng)計(jì)學(xué)的意義诞丽。

參考資料

A comprehensive evaluation of normalization methods for Illumina high-throughput RNA sequencing data analysis

https://www.biostars.org/p/273537/

What the FPKM? A review of RNA-Seq expression units

http://www.rna-seqblog.com/rpkm-fpkm-and-tpm-clearly-explained/

本文分享自微信公眾號(hào) - 生信技能樹(biotrainee),作者:Arjuna

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末拐格,一起剝皮案震驚了整個(gè)濱河市僧免,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌捏浊,老刑警劉巖懂衩,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異金踪,居然都是意外死亡浊洞,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門胡岔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來法希,“玉大人,你說我怎么就攤上這事靶瘸∩灰啵” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵怨咪,是天一觀的道長屋剑。 經(jīng)常有香客問我,道長诗眨,這世上最難降的妖魔是什么饼丘? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮辽话,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘卫病。我一直安慰自己油啤,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布蟀苛。 她就那樣靜靜地躺著益咬,像睡著了一般。 火紅的嫁衣襯著肌膚如雪帜平。 梳的紋絲不亂的頭發(fā)上幽告,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音裆甩,去河邊找鬼冗锁。 笑死,一個(gè)胖子當(dāng)著我的面吹牛嗤栓,可吹牛的內(nèi)容都是我干的冻河。 我是一名探鬼主播箍邮,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼叨叙!你這毒婦竟也來了锭弊?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤擂错,失蹤者是張志新(化名)和其女友劉穎味滞,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體钮呀,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡剑鞍,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了行楞。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片攒暇。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖子房,靈堂內(nèi)的尸體忽然破棺而出形用,到底是詐尸還是另有隱情,我是刑警寧澤证杭,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布田度,位于F島的核電站,受9級(jí)特大地震影響解愤,放射性物質(zhì)發(fā)生泄漏镇饺。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一送讲、第九天 我趴在偏房一處隱蔽的房頂上張望奸笤。 院中可真熱鬧,春花似錦哼鬓、人聲如沸监右。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽健盒。三九已至,卻和暖如春称簿,著一層夾襖步出監(jiān)牢的瞬間扣癣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國打工憨降, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留父虑,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓授药,卻偏偏與公主長得像频轿,于是被迫代替她去往敵國和親垂涯。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容