統(tǒng)計(jì)學(xué)5-貝葉斯法則

貝葉斯

托馬斯·貝葉斯(Thomas Bayes斑芜,1702-1761),18世紀(jì)英國(guó)神學(xué)家祟霍、數(shù)學(xué)家杏头、數(shù)理統(tǒng)計(jì)學(xué)家和哲學(xué)家,概率論理論創(chuàng)始人沸呐,貝葉斯統(tǒng)計(jì)的創(chuàng)立者醇王,“歸納地”運(yùn)用數(shù)學(xué)概率,“從特殊推論一般崭添、從樣本推論全體”的第一人寓娩。【1】


TB.jpg

BTW,貝葉斯創(chuàng)立貝葉斯統(tǒng)計(jì)的本意棘伴,是要證明上帝的存在(步偉大的艾薩克·牛頓爵士的后塵)寞埠,然而可能連他自己都沒(méi)有想到的是,這一理論最終成為了人工智能和統(tǒng)計(jì)學(xué)賴以建立的“Holy Grail ”焊夸。

條件概率

直接介紹貝葉斯法則可能會(huì)讓初學(xué)者有些茫然不知所措(比方說(shuō)我仁连。。阱穗。)怖糊,讓我們從貝葉斯法則的基礎(chǔ)條件概率開始說(shuō)起。

例如颇象,假定人口總體的 1% 患癌伍伤。對(duì)一群人進(jìn)行癌癥檢測(cè),得到陽(yáng)性檢驗(yàn)測(cè)試結(jié)果的概率依賴于你是否具有某種特殊條件遣钳。如果具備條件扰魂,測(cè)試結(jié)果就是陽(yáng)性的。

由此蕴茴,我們?cè)O(shè)事件A和B:

  1. B:目標(biāo)人患癌劝评。
  2. \bar{B} :目標(biāo)人不患癌。
  3. A:目標(biāo)人癌癥檢驗(yàn)為陽(yáng)性倦淀。
  4. \bar{A} :目標(biāo)人癌癥檢驗(yàn)為陰性蒋畜。

在實(shí)際的生產(chǎn)生活中,一些事件發(fā)生的概率往往是已知的撞叽,如人口總體中患癌的概率姻成,這種事件的概率稱為先驗(yàn)概率

通常事件并不像擲硬幣和骰子一樣是獨(dú)立的愿棋。實(shí)際上科展,某個(gè)事件的結(jié)果依賴于之前的事件。被依賴事件可以理解為依賴事件的“因”糠雨,依賴事件是被依賴事件的“果”才睹,例如這里,B(目標(biāo)人患癌)就是被依賴事件甘邀,也就是“因”琅攘,而A(目標(biāo)人癌癥檢測(cè)為陽(yáng)性)就是依賴事件,是“果”松邪。因?yàn)锽事件發(fā)生了坞琴,才會(huì)有A事件發(fā)生。在B事件發(fā)生的情況下测摔,A事件發(fā)生的概率就是條件概率置济。

我們通過(guò)以下方式用公式表示兩個(gè)事件的條件概率:


con_prop.png

在這個(gè)??中,我們要表達(dá)的意思是:


dis.png

其中 |代表 "鑒于"锋八,∩ 代表 "和"浙于。

  • 聯(lián)合概率
    P(A∩B):稱為聯(lián)合概率。意思是事件A B同時(shí)發(fā)生的概率挟纱。在這個(gè)??里羞酗,表示目標(biāo)人患癌且檢測(cè)結(jié)果為陽(yáng)性。

  • 條件概率計(jì)算公式的變形:乘法公式
    P(A∩B)=P(B)P(A|B)
    利用這個(gè)公式把復(fù)雜概率分解成互不相容的簡(jiǎn)單事件概率:
    P(A|B)+P(\bar{A}|B) = 1

  • 由條件概率公式可得全概率公式
    P(A) = P(A|B) * P(B) + P(A|\bar{B}) * P(\bar{B})

貝葉斯法則

后驗(yàn)概率

后驗(yàn)概率和條件概率類似紊服,都是描述在一個(gè)事件發(fā)生的情況下檀轨,另一個(gè)事件發(fā)生的概率。但是與條件概率的不同之處在于欺嗤,它限定了目標(biāo)事件為被依賴事件参萄,而其中的條件為依賴事件,通常就是觀測(cè)結(jié)果煎饼。 如果說(shuō)條件概率是由因求果讹挎,那么后驗(yàn)概率就是由果求因∵壕粒【2】

回到我們之前的??:
在A事件(目標(biāo)人癌癥檢測(cè)為陽(yáng)性)發(fā)生的情況下筒溃,B事件(目標(biāo)人患癌)發(fā)生的概率就是后驗(yàn)概率
P(B|A)

貝葉斯法則定義

貝葉斯法則就是由先驗(yàn)概率求后驗(yàn)概率的公式沾乘。

貝葉斯法則怜奖, 盡管它是一個(gè)數(shù)學(xué)公式,但其原理毋需數(shù)字也可明了翅阵。如果你看到一個(gè)人總是做一些好事歪玲,則那個(gè)人多半會(huì)是一個(gè)好人。這就是說(shuō)掷匠,當(dāng)你不能準(zhǔn)確知悉一個(gè)事物的本質(zhì)時(shí)读慎,你可以依靠與事物特定本質(zhì)相關(guān)的事件出現(xiàn)的多少去判斷其本質(zhì)屬性的概率。 用數(shù)學(xué)語(yǔ)言表達(dá)就是:支持某項(xiàng)屬性的事件發(fā)生得愈多槐雾,則該屬性成立的可能性就愈大【3】夭委。

求解過(guò)程

我們將前面的問(wèn)題完整化:
假定人口總體的 1%患癌。如果患癌募强,檢測(cè)結(jié)果為陽(yáng)性的可能性為 90%株灸,如果不患癌,檢測(cè)結(jié)果為陰性的可能性為 90%擎值,在這種情景下慌烧,如果你的測(cè)試結(jié)果為陽(yáng)性,患癌的概率是多少鸠儿?

以下是問(wèn)題求解過(guò)程的簡(jiǎn)圖:


sol.png
  • 首先看圖的左上角:
    事件C表示人口總體中患癌的概率(先驗(yàn)概率):
    P(C) = 0.01

  • 經(jīng)過(guò)Test(癌癥檢測(cè))屹蚊,發(fā)現(xiàn):

  1. 患癌人群中厕氨,檢驗(yàn)結(jié)果為陽(yáng)性的概率:P(Pos|C):0.9
  2. 非患癌人群中,檢驗(yàn)結(jié)果為陰性的概率:P(Neg|\bar{C}):0.9
  • 右圖P(Pos|C) 為0.9
  • 右圖P(Pos|\bar{C})
    由上文乘法公式的推論汹粤,P(Pos|\bar{C}) = 1 - P(Neg|\bar{C}) = 0.1
  • 由條件概率計(jì)算公式:
    P(C命斧,Pos) = P(Pos|C) * P(C) = 0.9 * 0.01 = 0.009 (圖左下角紅色部分)
    P(\bar{C},Pos) = P(Pos|\bar{C}) * P(\bar{C}) = 0.1 * 0.99 = 0.099(圖左下角綠色部分)
  • 歸一化
    因?yàn)镻(C嘱兼,Pos)和P(\bar{C}国葬,Pos) 的和不為1,所以需要對(duì)前兩個(gè)概率歸一化芹壕,即分別求他們對(duì)和的比例汇四。二者的和為紫色線內(nèi)的部分。
    P(C|Pos) = P(C踢涌,Pos) / ( P(C通孽,Pos) + P(\bar{C},Pos) ) = 0.009/(0.009 + 0.099) = 0.083
    P(\bar{C}|Pos) = P(\bar{C}睁壁,Pos) / ( P(C利虫,Pos) + P(\bar{C},Pos) ) = 0.099/(0.009 + 0.099) = 0.917
  • 最終堡僻,我們通過(guò)先驗(yàn)概率求出了后驗(yàn)概率糠惫。
    P(C|Pos) = 0.083
    P(\bar{C}|Pos) = 0.917

specificity

特異度,如果不患癌钉疫,檢測(cè)結(jié)果為陰性的可能性為 90%硼讽。

sensitivity

敏感度,如果患癌牲阁,檢測(cè)結(jié)果為陽(yáng)性的可能性為 90%固阁。

【1】托馬斯·貝葉斯
【2】后驗(yàn)概率與條件概率區(qū)別 這里作者為了強(qiáng)調(diào)后驗(yàn)概率和條件概率的區(qū)別,將條件概率狹義的理解為“由因求果”城菊,不是很嚴(yán)謹(jǐn)备燃,但是便于突出后驗(yàn)概率的特點(diǎn)。還請(qǐng)讀者注意凌唬。
【3】貝葉斯公式

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末并齐,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子客税,更是在濱河造成了極大的恐慌况褪,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,185評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件更耻,死亡現(xiàn)場(chǎng)離奇詭異测垛,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)秧均,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門食侮,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)号涯,“玉大人,你說(shuō)我怎么就攤上這事锯七×纯欤” “怎么了?”我有些...
    開封第一講書人閱讀 163,524評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵起胰,是天一觀的道長(zhǎng)久又。 經(jīng)常有香客問(wèn)我巫延,道長(zhǎng)效五,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,339評(píng)論 1 293
  • 正文 為了忘掉前任炉峰,我火速辦了婚禮畏妖,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘疼阔。我一直安慰自己戒劫,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評(píng)論 6 391
  • 文/花漫 我一把揭開白布婆廊。 她就那樣靜靜地躺著迅细,像睡著了一般。 火紅的嫁衣襯著肌膚如雪淘邻。 梳的紋絲不亂的頭發(fā)上茵典,一...
    開封第一講書人閱讀 51,287評(píng)論 1 301
  • 那天,我揣著相機(jī)與錄音宾舅,去河邊找鬼统阿。 笑死,一個(gè)胖子當(dāng)著我的面吹牛筹我,可吹牛的內(nèi)容都是我干的扶平。 我是一名探鬼主播,決...
    沈念sama閱讀 40,130評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼蔬蕊,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼结澄!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起岸夯,我...
    開封第一講書人閱讀 38,985評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤概而,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后囱修,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體赎瑰,經(jīng)...
    沈念sama閱讀 45,420評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評(píng)論 3 334
  • 正文 我和宋清朗相戀三年破镰,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了餐曼。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片压储。...
    茶點(diǎn)故事閱讀 39,779評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖源譬,靈堂內(nèi)的尸體忽然破棺而出集惋,到底是詐尸還是另有隱情,我是刑警寧澤踩娘,帶...
    沈念sama閱讀 35,477評(píng)論 5 345
  • 正文 年R本政府宣布刮刑,位于F島的核電站,受9級(jí)特大地震影響养渴,放射性物質(zhì)發(fā)生泄漏雷绢。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評(píng)論 3 328
  • 文/蒙蒙 一理卑、第九天 我趴在偏房一處隱蔽的房頂上張望翘紊。 院中可真熱鬧,春花似錦藐唠、人聲如沸帆疟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)踪宠。三九已至,卻和暖如春妈嘹,著一層夾襖步出監(jiān)牢的瞬間柳琢,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工蟋滴, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留染厅,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,876評(píng)論 2 370
  • 正文 我出身青樓津函,卻偏偏與公主長(zhǎng)得像肖粮,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子尔苦,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 1 貝葉斯方法 長(zhǎng)久以來(lái)涩馆,人們對(duì)一件事情發(fā)生或不發(fā)生的概率,只有固定的0和1允坚,即要么發(fā)生魂那,要么不發(fā)生,從來(lái)不會(huì)去考...
    zhoulujun閱讀 9,454評(píng)論 0 20
  • 基本公式 全概率公式:設(shè)試驗(yàn)E的樣本空間為S稠项,A為E的事件涯雅,B1,B2,...,Bn為S的一個(gè)劃分,并且P(Bi)...
    iAstrolien閱讀 1,943評(píng)論 0 3
  • 學(xué)習(xí)的本質(zhì)展运, 不在于記住了知識(shí)活逆, 而在于它觸發(fā)了你的思考精刷。 父母教育孩子,僅有愛夠嗎蔗候? 除了愛怒允,還要懂得孩子的成長(zhǎng)...
    祖邇閱讀 54評(píng)論 0 0
  • 不知為什么,我特別喜歡捕捉陽(yáng)光锈遥。沒(méi)當(dāng)天空有一絲耀眼的陽(yáng)光的時(shí)候纫事,我就喜歡拿起手機(jī)拍下那一絲光芒∷模總覺得那光芒萬(wàn)丈丽惶,...
    簡(jiǎn)書的簡(jiǎn)妹閱讀 299評(píng)論 0 0
  • 2018年9月28日,我在堅(jiān)持星球訓(xùn)練營(yíng)迎來(lái)了我的第一根面條——一位美麗的小姐姐庆寺,那天晚上我第一次與她溝通的時(shí)候蚊夫,...
    東哥在江湖閱讀 552評(píng)論 4 2