跨物種RNA-seq標(biāo)準(zhǔn)化及差異表達(dá)

前言

對跨物種的RNA-seq進(jìn)行標(biāo)準(zhǔn)化和差異分析已知是一個問題,而目前對此類問題的相關(guān)研究還比較少豆茫,有用RPKM進(jìn)行各物種之間標(biāo)準(zhǔn)化的牺氨,也有基于count文件利用DESeq2的標(biāo)準(zhǔn)化方法對各物種進(jìn)行標(biāo)準(zhǔn)化的锅铅,而今天介紹的方法來自于文章:《A statistical normalization method and differential expression analysis for RNA-seq data between different species》

跨物種基因


首先,對于同一物種相同基因的比較层玲,由于其基因長度和功能都一樣,因此可以直接比較反症;而對于跨物種的RNA-seq比較來說辛块,一般選取直系同源的基因來比較

跨物種RNA-seq基本模型

首先,作者定義基本模型如下:


其中:

  1. E(Xgkt) 代表物種 t 中文庫 k 基因 g 基因觀測到的count值的期望(均值铅碍;上式右邊可以看作為對 μgk 求均值的過程憨降,因此式子左邊用 E(Xgkt) 表示,另外一層意思參照下面的泊松分布模型)该酗;
  2. Xgkt 代表物種 t 中文庫 k 基因 g 觀測到的count
  3. μgkt 代表物種 t 中文庫 k 基因 g 的真實(shí)表達(dá)水平授药;
  4. Lgkt 代表物種 t 中文庫 k 基因 g 的基因長度;
  5. St 代表
  6. Nt 代表物種 t 中呜魄,文庫 k 的所有基因count數(shù)總和悔叽;


上面的模型建立了物種 t 中文庫 k 基因 g 的真實(shí)表達(dá)水平與觀測值之間的關(guān)系,有助于下一步的標(biāo)準(zhǔn)化及差異分析

跨物種RNA-seq標(biāo)準(zhǔn)化及差異分析

首先對于兩個物種的直系同源基因的比較爵嗅,我們有如下假設(shè):


那么H0對應(yīng)該基因沒有差異表達(dá)娇澎,H1對應(yīng)該基因發(fā)生了差異表達(dá);之前我們說 Xgkt 代表物種 t 中文庫 k 基因 g 觀測到的count睹晒,那么事實(shí)上對于其中兩個物種的直系同源基因趟庄,我們需要對每一個基因的真實(shí)表達(dá)值(count值)假設(shè)一個分布,方便后續(xù)的假設(shè)檢驗(yàn)伪很,作者這里利用的是泊松分布
因此定義泊松分布的參數(shù):

這里的泊松分布模型可以理解為對 Xgkt 做多次測量戚啥,最終對 Xgkt 做的一個頻率分布(橫坐標(biāo)為 Xgkt ,縱坐標(biāo)為頻率)服從泊松分布

基于上面的模型锉试,我們可以對H0做恒等變換猫十,所以我們的假設(shè)問題就轉(zhuǎn)變成為了:



所以滿足H0的直系同源基因,我們認(rèn)為是沒有差異的呆盖;否則就是有差異的

跨物種RNA-seq差異分析p值計(jì)算

又由于當(dāng)我們獲得實(shí)際測的數(shù)據(jù)后拖云,對于兩個物種來說,滿足:


Xgk1 + Xgk2 等于一個定值应又,因此我們可以引入伯努利實(shí)驗(yàn)的思想宙项,構(gòu)建二項(xiàng)分布:

  1. Xgk1 代表物種 t 中文庫 k 基因 g 觀測到的count
  2. xgk1 代表從 1—ngk 的count數(shù)

其中:



則p值計(jì)算如下:



所謂p值,本質(zhì)上就是比較括號內(nèi)前一項(xiàng)比后一項(xiàng)大的概率

  1. Xgkt 表示實(shí)際觀測到的在物種 1 中文庫 k 基因 g 觀測到的count數(shù)



  1. xgk1 代表從 1—ngk 的count數(shù)株扛;即計(jì)算 xgk1 取從 1—ngk 的count數(shù)時尤筐,(1)比(2)大的概率邑贴,即為p值

最后附上該文章的R包鏈接:SCBN

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市叔磷,隨后出現(xiàn)的幾起案子拢驾,更是在濱河造成了極大的恐慌,老刑警劉巖改基,帶你破解...
    沈念sama閱讀 219,270評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件繁疤,死亡現(xiàn)場離奇詭異,居然都是意外死亡秕狰,警方通過查閱死者的電腦和手機(jī)稠腊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來鸣哀,“玉大人架忌,你說我怎么就攤上這事∥页模” “怎么了叹放?”我有些...
    開封第一講書人閱讀 165,630評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長挠羔。 經(jīng)常有香客問我井仰,道長,這世上最難降的妖魔是什么破加? 我笑而不...
    開封第一講書人閱讀 58,906評論 1 295
  • 正文 為了忘掉前任俱恶,我火速辦了婚禮,結(jié)果婚禮上范舀,老公的妹妹穿的比我還像新娘合是。我一直安慰自己,他們只是感情好锭环,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,928評論 6 392
  • 文/花漫 我一把揭開白布聪全。 她就那樣靜靜地躺著,像睡著了一般田藐。 火紅的嫁衣襯著肌膚如雪荔烧。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,718評論 1 305
  • 那天汽久,我揣著相機(jī)與錄音,去河邊找鬼踊餐。 笑死景醇,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的吝岭。 我是一名探鬼主播三痰,決...
    沈念sama閱讀 40,442評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼吧寺,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了散劫?” 一聲冷哼從身側(cè)響起稚机,我...
    開封第一講書人閱讀 39,345評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎获搏,沒想到半個月后赖条,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,802評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡常熙,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,984評論 3 337
  • 正文 我和宋清朗相戀三年纬乍,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片裸卫。...
    茶點(diǎn)故事閱讀 40,117評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡仿贬,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出墓贿,到底是詐尸還是另有隱情茧泪,我是刑警寧澤,帶...
    沈念sama閱讀 35,810評論 5 346
  • 正文 年R本政府宣布聋袋,位于F島的核電站调炬,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏舱馅。R本人自食惡果不足惜缰泡,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,462評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望代嗤。 院中可真熱鬧棘钞,春花似錦、人聲如沸干毅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽硝逢。三九已至姨拥,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間渠鸽,已是汗流浹背叫乌。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留徽缚,地道東北人憨奸。 一個月前我還...
    沈念sama閱讀 48,377評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像凿试,于是被迫代替她去往敵國和親排宰。 傳聞我的和親對象是個殘疾皇子似芝,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,060評論 2 355

推薦閱讀更多精彩內(nèi)容