1.前言
數(shù)學(xué)一直是我的弱項(xiàng)炬转,從初中到大學(xué)成績(jī)都不好辆苔,于是累覺不愛,與數(shù)學(xué)從此絕緣扼劈。反而離開校園后驻啤,有時(shí)對(duì)某一方面的數(shù)學(xué)問題產(chǎn)生興趣,就會(huì)繼續(xù)追尋下去荐吵。就像這個(gè)神奇的貝葉斯定理骑冗,原理多看幾遍其實(shí)很簡(jiǎn)單,但是上學(xué)那會(huì)兒怎么總是學(xué)不會(huì)呢先煎?大概上學(xué)的時(shí)候贼涩,只是單純的記憶公式,而數(shù)學(xué)是對(duì)現(xiàn)實(shí)的高度抽象薯蝎,恰恰是人類大腦所不擅長(zhǎng)的領(lǐng)域遥倦,而工作后帶著實(shí)際問題去學(xué)習(xí)數(shù)學(xué),符合人類從具體走向抽象的認(rèn)知規(guī)律占锯,故而能夠理解袒哥。
貝葉斯定理正是在這個(gè)背景下,被我初步理解的消略。所以各位不要覺得涉及到數(shù)學(xué)就覺得畏懼堡称,連我這個(gè)數(shù)學(xué)渣都能理解,其他人更是不在話下疑俭。后面會(huì)講到粮呢,貝葉斯定理作為一個(gè)思考的框架,一種決策的工具钞艇,具有神奇的作用啄寡。這正是我們構(gòu)建多元化思維模型中數(shù)學(xué)模型的一部分。
2.什么是貝葉斯定理
我們將一枚硬幣拋向空中哩照,落地時(shí)正面和反面的概率都是50%挺物,這是常識(shí)。但如果我們拋100次飘弧,正面和反面的次數(shù)并不會(huì)都是50识藤,有可能正面40次,反面60次次伶。那拋1000次痴昧,10000次呢,正面反面的次數(shù)有可能還不會(huì)是五五開冠王。只有將拋硬幣無(wú)數(shù)次赶撰,正面和反面出現(xiàn)的次數(shù)才會(huì)趨向于相等。也就是說(shuō),正面和反面出現(xiàn)的概率50%是一個(gè)極限豪娜、客觀的概率餐胀,并不會(huì)隨著拋擲次數(shù)的增減而變化。
但是貝葉斯定理與這個(gè)精確客觀的概率不同瘤载,它要求當(dāng)事人估計(jì)一個(gè)主觀的先驗(yàn)概率否灾,再根據(jù)隨后觀察到的事實(shí)進(jìn)行調(diào)整,隨著調(diào)整次數(shù)的增加鸣奔,結(jié)果將會(huì)越來(lái)越精確墨技。這里有一個(gè)問題,數(shù)學(xué)不是講究客觀嗎溃蔫?這里怎么冒出一個(gè)主觀概率出來(lái)健提?這也是當(dāng)時(shí)的學(xué)者質(zhì)疑貝葉斯的問題。事實(shí)上伟叛,貝葉斯定理在17世紀(jì)提出后私痹,一直受到冷落,直到20世紀(jì)30年代電子計(jì)算機(jī)出現(xiàn)后才得到廣泛應(yīng)用统刮。如今我們每天都在和貝葉斯定理打交道:你上搜索引擎搜尋問題紊遵,背后的算法中就有貝葉斯公式的身影;你郵箱里的垃圾郵件侥蒙,很有可能就是運(yùn)用貝葉斯定理幫你攔截的暗膜。
為什么會(huì)出現(xiàn)這種情況?因?yàn)樨惾~斯定理符合人類認(rèn)知事物的自然規(guī)律鞭衩。我們并非生而知之学搜,大多數(shù)時(shí)候,面對(duì)的是信息不充分论衍、情況不確定瑞佩,這個(gè)時(shí)候我們只能在有限資源的情況下,作出決定坯台,再根據(jù)后續(xù)的發(fā)展進(jìn)行修正炬丸。實(shí)際上,這也是科學(xué)研究的步驟蜒蕾。
說(shuō)了這么多稠炬,貝葉斯定理到底長(zhǎng)什么樣啊咪啡?圍觀群眾的小心臟可承受不起一坨擠眉弄眼的數(shù)學(xué)符號(hào)首启。那簡(jiǎn)單的用中文來(lái)描述一下:
后驗(yàn)概率=先驗(yàn)概率調(diào)整因子*
是不是也沒這么難?沒錯(cuò)撤摸,就是這么簡(jiǎn)單毅桃。翻譯成數(shù)學(xué)語(yǔ)言就是:
P(A丨B)=P(A)P(B丨A)/P(B)*
這是一一對(duì)應(yīng)的栽惶,P(A丨B)是后驗(yàn)概率,P(A)是先驗(yàn)概率疾嗅,P(B丨A)/P(B)是調(diào)整因子。P(A丨B)意思是在B發(fā)生的情況下冕象,A發(fā)生的概率代承;P(B丨A)意思是在A發(fā)生的情況下,B發(fā)生的概率渐扮;P(A)是A發(fā)生的概率论悴,P(B)是B發(fā)生的概率。P(B)=P(B丨A)P(A)+P(B丨A')P(A')墓律,這稱為全概率公式膀估。
看到這里,是不是有點(diǎn)糊涂了耻讽?其實(shí)這些公式并不難察纯,證明過程也很簡(jiǎn)單,自己搜一下文氏圖针肥,一目了然”牵現(xiàn)在看起來(lái),這些公式還是太抽象慰枕,別急具则,到后面實(shí)例的時(shí)候就派上用場(chǎng)了。
3.貝葉斯定理有什么用
先來(lái)看一個(gè)非常經(jīng)典的例子具帮,幾乎是講到貝葉斯定理必提博肋。
某種病發(fā)病率約為0.1%,即1000人中有一個(gè)人是陽(yáng)性蜂厅,現(xiàn)在的檢測(cè)手段很成熟匪凡,準(zhǔn)確率高達(dá)99%,但是有5%的誤報(bào)率葛峻。如果一個(gè)人的檢測(cè)結(jié)果呈陽(yáng)性锹雏,那么這個(gè)人真的感染這種病的概率有多大?
使用貝葉斯定理分析术奖,假設(shè)A為得病礁遵,B為檢測(cè)呈陽(yáng)性〔杉牵可知P(A)=0.001佣耐,P(B丨A)=0.99,P(B)=P(B丨A) P(A)+P(B丨A')P(A')=0.99x0.001+0.05x0.999=0.05094
P(A丨B)=P(A)*P(B丨A)/P(B)=0.001x0.99/0.05094=0.019
是不是很驚訝唧龄,哪怕準(zhǔn)確率這么高兼砖,檢測(cè)結(jié)果呈陽(yáng)性的可信度只有2%。如果一種病的發(fā)病率很低,對(duì)于檢測(cè)結(jié)果呈陽(yáng)性讽挟,我們不用過多擔(dān)憂懒叛。
來(lái)看看貝葉斯定理更實(shí)際的用處——幫助你量化對(duì)某些事物的態(tài)度或看法。比如說(shuō)耽梅,你看到周圍很多人去廟里拜菩薩薛窥,他們跟你說(shuō)很靈的,心想事成眼姐,你是否應(yīng)該相信他們呢诅迷?作為一個(gè)追求獨(dú)立思考的人,肯定不能憑別人幾句話就決定皈依我佛众旗。正確的態(tài)度是罢杉,自己去統(tǒng)計(jì)多少人信奉佛教,其中多少人祈福有求必應(yīng)贡歧,如果比例很高的話滩租,那我們就可以相信。但事實(shí)上艘款,限于個(gè)人的能力和時(shí)間持际,這種大規(guī)模的統(tǒng)計(jì)我們無(wú)法做到。但是有了貝葉斯定理哗咆,我們可以試著計(jì)算一下蜘欲。
A代表相信向菩薩祈福有用,假設(shè)你半信半疑晌柬,給定P(A)=0.5姥份,B代表一個(gè)朋友向菩薩許事業(yè)的愿后,果然升職加薪年碘。假設(shè)你認(rèn)為朋友對(duì)你說(shuō)了實(shí)話澈歉,P(B丨A)=0.8,如果沒有菩薩保佑屿衅,你認(rèn)為他憑借自己能力升職加薪的概率P(B丨A')=0.5埃难,根據(jù)全概率公式,P(B)=0.8x0.5+0.5*0.5=0.65涤久∥谐荆可以算出,
P(A丨B)=0.5x0.8/0.65=0.615响迂。這時(shí)考抄,你對(duì)菩薩的信任度已經(jīng)從50%上升到了61.5%,說(shuō)明看到你朋友的事后蔗彤,你是越來(lái)越相信菩薩的作用的川梅。如果再多幾個(gè)同事向你訴說(shuō)他們的心想事成疯兼,你的信任度越來(lái)越高,最后就會(huì)皈依我佛了贫途。
但世上沒這么好的事吧彪,要是都心想事成,那不世界太平了丢早。所以你接下來(lái)碰到了另外一個(gè)同事来氧,他說(shuō)他去求了菩薩愛情,至今仍是光棍一條香拉。于是你就開始調(diào)整你的看法。注意中狂,這時(shí)的P(A)=0.615凫碌,B代表菩薩未能保佑抱得美人歸,P(B丨A)=0.2胃榕,不變的是P(B丨A')=0.5盛险,此時(shí)P(B)=0.2x0.615+0.5*0.385=0.3155,可以算出勋又, P(A丨B)=0.615x0.2/0.3155=0.39苦掘。這時(shí),你對(duì)菩薩的信任度又由61.5%下降到了39%楔壤,如果再碰到幾個(gè)這樣的同事鹤啡,你就會(huì)徹底對(duì)菩薩保佑失去信心。
事實(shí)上蹲嚣,我們可以用貝葉斯定理來(lái)搭建一個(gè)思考的框架递瑰,不斷的動(dòng)態(tài)調(diào)整我們的看法或態(tài)度,在經(jīng)過一系列的事情證實(shí)后隙畜,就會(huì)形成比較穩(wěn)定而正確的看法抖部。大多數(shù)人對(duì)事物的看法是搖擺不定的,因?yàn)槲覀兊闹庇X思維是粗放而快速议惰,所以很難穩(wěn)定下來(lái)慎颗。而運(yùn)用貝葉斯定理以后,它能夠量化我們的看法言询,不致于因個(gè)人的偏好而偏差太遠(yuǎn)俯萎,而且哪怕你給定的先驗(yàn)概率是隨便寫的,也沒關(guān)系倍试,經(jīng)過幾次事實(shí)的印證后讯屈,它會(huì)越來(lái)越接近于真相。