學(xué)習(xí):StatQuest-Fisher’s Exact test

前言

這次我們談?wù)撓赂患治龅臋z驗踏幻,富集分析通常是來看我們感興趣的內(nèi)容知否在某個數(shù)據(jù)集中有富集

富集分析算法

這里引用大佬之前總結(jié)的:http://www.reibang.com/p/988d90484f77

有興趣的同學(xué)可以進(jìn)去原帖子看一下

Fisher’s Exact test

個人感覺該視頻所介紹的內(nèi)容不太好,這里引用其他同學(xué)的例子:


image.png

Fisher’s Exact test檢驗的是行列之間是否有相關(guān)
零假設(shè):行列變量之間不相關(guān)
備擇假設(shè):行列變量相關(guān)

該例子描述的是節(jié)食是否和男女有關(guān)
那么這個的p_value按照超幾何分布來計算


image.png

但是這并不是我們最終計算的p_value韩脏,接下來我們介紹個更具體的例子:
假設(shè)是說我的一手?jǐn)?shù)據(jù)是這樣的


image.png

image.png

我們按照上述公式來計算該情況的p_value
當(dāng)然我們還要計算比這個情況更極端的情況
image.png

及當(dāng)左上角的數(shù)據(jù)變?yōu)?的時候的p_value(其他數(shù)據(jù)跟著做調(diào)整)
如果左上角的數(shù)據(jù)不為0宁否,那么依次減一窒升,直到為0,并計算對應(yīng)情形的p_value


image.png

此時將每種情況計算的p_value相加慕匠,即為最后的p_value
p-value=0.001346076 + 0.000033652 = 0.001379728

總結(jié)

fisher.test的核心就是比較兩個類群的比例是否有差異
比如上述例子饱须,節(jié)食是否與性別有關(guān),意思是分為男台谊,女兩個類別蓉媳,兩個類別中節(jié)食人數(shù)所占該類別總?cè)藬?shù)的比例是否有統(tǒng)計學(xué)差異
顯然:男,0/12
女锅铅,10/12
這是就有顯著性差異的酪呻,也就是說節(jié)食與性別有關(guān),并且計算p_value的公式為:


再有兩個例子:



我們想看深圳的的大學(xué)人數(shù)在深圳總?cè)藬?shù)的占比是不是顯著高于廣東
也可以分為兩個類別:深圳市和廣東省
我們分別計算深圳市的大學(xué)生人數(shù)占比盐须,和廣東省大學(xué)生人數(shù)占比:
顯然玩荠,深圳市,200/500贼邓;廣東省姨蟋,800/2300
深圳市的占比高于廣東省,所以說明大學(xué)生在深圳是富集的立帖。在深圳市大學(xué)生的成分較廣東省整體要多
那么p_value的計算公式中眼溶,N代表廣東省所有的人口,n代表深圳市所有的人口晓勇,M為廣東省所有的大學(xué)生人數(shù)堂飞,i 為深圳大學(xué)生人口的極端情況的數(shù)值灌旧,在該例子中 i 為 0到199

還有就是GO富集:



在做GO富集時,我們篩選出來的差異基因數(shù)目一共500個绰筛,在A通路的有200個枢泰,而對于該物種,總共有2300個基因铝噩,在A通路的一共800個衡蚂,那么:
在差異基因這個類群中,在A通路的占比為200/500骏庸;從全部基因來看毛甲,在A通路的占比為800/2300
顯然,相比較整體具被,在差異基因這個類別玻募,大部分基因執(zhí)行A通路的功能,那么個體間的這種差異主要體現(xiàn)在A通路上
那么p_value的計算公式中一姿,N代表總的背景基因數(shù)目七咧;n代表所有的差異基因數(shù)目;M為在A通路中叮叹,被注釋到的背景基因數(shù)目艾栋;i 為差異基因的極端情況的數(shù)值,在該例子中 i 為 0到199

所以總結(jié)來說:fisher.test一方面可以檢測矩陣橫縱變量是否有相關(guān)性蛉顽;另一方面可以檢測矩陣兩個類別某項比例是否差異顯著蝗砾,某項指標(biāo)在某一類別內(nèi)是否具有更多的成分

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市蜂林,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌拇泣,老刑警劉巖噪叙,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異霉翔,居然都是意外死亡睁蕾,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進(jìn)店門债朵,熙熙樓的掌柜王于貴愁眉苦臉地迎上來子眶,“玉大人,你說我怎么就攤上這事序芦〕艚埽” “怎么了?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵谚中,是天一觀的道長渴杆。 經(jīng)常有香客問我寥枝,道長,這世上最難降的妖魔是什么磁奖? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任囊拜,我火速辦了婚禮,結(jié)果婚禮上比搭,老公的妹妹穿的比我還像新娘冠跷。我一直安慰自己,他們只是感情好身诺,可當(dāng)我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布蜜托。 她就那樣靜靜地躺著,像睡著了一般戚长。 火紅的嫁衣襯著肌膚如雪盗冷。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天同廉,我揣著相機(jī)與錄音仪糖,去河邊找鬼。 笑死迫肖,一個胖子當(dāng)著我的面吹牛锅劝,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蟆湖,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼故爵,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了隅津?” 一聲冷哼從身側(cè)響起诬垂,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎伦仍,沒想到半個月后结窘,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡充蓝,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年隧枫,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片谓苟。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡官脓,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出涝焙,到底是詐尸還是另有隱情卑笨,我是刑警寧澤,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布仑撞,位于F島的核電站湾趾,受9級特大地震影響芭商,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜搀缠,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一铛楣、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧艺普,春花似錦簸州、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至瑰步,卻和暖如春矢洲,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背缩焦。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工读虏, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人袁滥。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓盖桥,卻偏偏與公主長得像,于是被迫代替她去往敵國和親题翻。 傳聞我的和親對象是個殘疾皇子揩徊,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容