在閱讀《小心串慰,邏輯思維的陷阱》一書中偏塞,有兩個故事引起了我的注意。不是故事本身如何神奇邦鲫,而是第一次知道了平凡而又神奇的貝葉斯方法灸叼。
1. 貝葉斯方法與空難搜索
在1966年神汹,美國的一架轟炸機在西班牙上空進行空中加油的時候和加油機意外碰撞,導(dǎo)致轟炸機和加油機均起火墜毀古今。更嚴重的是屁魏,當時轟炸機上帶著一枚氫彈,如果這顆氫彈發(fā)生什么意外捉腥,后果不堪設(shè)想氓拼。
美國立刻從國內(nèi)調(diào)集了包括多位專家在內(nèi)的搜索部隊前往現(xiàn)場,搜尋那顆氫彈但狭。但是殘骸散落的范圍非常大披诗,而且沒人知道當時氫彈是如何儲存在轟炸機上的,也不知道氫彈是怎么從轟炸機上脫離的立磁。還要考慮氫彈上的兩個降落傘各自打開的概率是多少呈队,當時的風速和方向是怎樣的,氫彈落到地上之后有可能被埋到土里唱歧,等等宪摧。
因此,搜尋隊一時束手無策颅崩,不知道從何處搜起几于。
最后,在這批專家中沿后,有一位數(shù)學(xué)家提出的沿彭,也不知道氫彈是怎么從轟炸機上脫離的。還要考慮氫彈上的兩個降落傘各自打開的概率是多少尖滚,當時的風速和方向是怎樣的喉刘,氫彈落到地上之后有可能被埋到土里,等等漆弄。因此睦裳,搜尋隊一時束手無策,不知道從何處搜起撼唾。
最后廉邑,在這批專家中,有一位數(shù)學(xué)家提出了自己的搜尋方案倒谷。
他先把整個殘骸散落的區(qū)域劃分成很多小方格蛛蒙,然后他召集了各方面的專家。這些專家都有自己擅長的領(lǐng)域渤愁,他們有的比較了解轟炸機的結(jié)構(gòu)宇驾,有的是氫彈專家,有的是流體力學(xué)家猴伶,有的是專門研究爆炸動力學(xué)的......這位數(shù)學(xué)家要他們每人做出自己的假設(shè),想象出各種可能的情境,然后在各種情境下他挎,估計氫彈落在各個小方格里的概率筝尾。這些專家各自的估計結(jié)果綜合到一起加權(quán)平均后,就得到了一張氫彈位置的概率圖——每一個小方格都有不同的概率值办桨。
然后筹淫,搜索隊根據(jù)這張概率圖開始搜索。他們從概率最高的格子開始搜索呢撞,一個格子搜索完后损姜,剩下的格子的概率就會進行更新,然后接著搜索其中概率最高的殊霞。
最后摧阅,氫彈很快就找到了。
2. 貝葉斯方法與海難搜索
兩年后绷蹲,美國海軍一艘核潛艇因為魚雷事故在大西洋某個海域失蹤了棒卷,潛艇和艇上的99名海軍官兵全部杳無音信。
為了尋找這艘核潛艇的下落祝钢,美國海軍進行了大規(guī)模的搜索比规,但搜救隊對失事時潛艇航行的速度及方向、爆炸沖擊力的大小及方向拦英、爆炸時潛艇方向舵的指向等等一概不知蜒什,事發(fā)時深海海流的流向、流速也只能估計疤估,所以很難確定潛艇殘骸的最終位置灾常。要在這么大的深海范圍內(nèi)尋找到這艘潛艇,幾乎是不可能的做裙。
這時岗憋,人們想起了上次組織尋找丟失氫彈的數(shù)學(xué)家。
這位數(shù)學(xué)家和搜索氫彈的時候一樣锚贱,他先是召集了相關(guān)領(lǐng)域的專家仔戈,讓他們想象各種可能發(fā)生的情況,并讓他們按照自己的經(jīng)驗判斷各種可能的概率拧廊。最后监徘,這片海域被劃分成很多小格子,每個格子都有一個初步的潛艇在這個格子里的概率吧碾。搜救隊每次尋找時凰盔,都會挑選整個區(qū)域內(nèi)概率值最高的格子進行搜索,如果沒有發(fā)現(xiàn)倦春,就會按照概率規(guī)律重新計算剩下的格子的概率户敬,搜尋船只就會駛向新的概率最高的格子進行搜索落剪。
海軍人員一開始憑經(jīng)驗搜尋了幾個月都一無所獲,后來使用了數(shù)學(xué)家的方法后尿庐,僅僅搜索數(shù)次忠怖,就在爆炸點西南方的海底找到失事潛艇。
這種通過概率計算來提高認識本體真相效率的方法叫“貝葉斯方法”抄瑟,現(xiàn)在已廣泛應(yīng)用于各種領(lǐng)域凡泣,特別是與人工智能相關(guān)的技術(shù)領(lǐng)域。
3.貝葉斯方法的前世今生
出于強烈的好奇心皮假,以下是通過度娘找來的相關(guān)貝葉斯方法的相關(guān)知識:
貝葉斯定理:P(A|B) = P(B|A) * P(A)/P(B)
用語言解釋就是:在B出現(xiàn)的前提下,A出現(xiàn)的概率等于A和B都出現(xiàn)的概率除以B出現(xiàn)的概率鞋拟。
換句話說就是后驗概率和先驗概率的關(guān)系。
A例子
假設(shè):目前的全集是一個小學(xué)的小學(xué)一年級學(xué)生惹资,A指代“穿白襪子”贺纲,B指代“是男生”。
這個小學(xué)一年級一共100人布轿,其中有男生30人哮笆,穿白襪子的人數(shù)一共有20個,這20個人里面汰扭,有5個是男生稠肘。那么請問,男生里面穿白襪子的人的出現(xiàn)概率為多少萝毛?
這不是廢話嘛项阴,一共30個男生,5個穿白襪子笆包,出現(xiàn)概率是5/30=1/6盎防俊!用得著貝葉斯公式嗎庵佣?歉胶!
如果已經(jīng)把人數(shù)都告訴你了,當然沒必要算什么先后驗概率巴粪,但是先不告訴你人數(shù)通今,只告訴你:
這個小學(xué)一年級學(xué)生里面,男生的出現(xiàn)概率是0.3 —— P(B)肛根;
穿白襪子的人的出現(xiàn)概率是0.2 —— P(A)辫塌;
穿白襪子的人是男生這件事出現(xiàn)的概率是0.25 —— P(B|A)。
請問你派哲,一個人是男生又穿白襪子的出現(xiàn)概率 —— P(A|B)是多少臼氨?
這個時候就該公式出場啦:P(A|B) = P(B|A) * P(A)/P(B) ==> P(A|B) = 0.25 * 0.2 / 0.3 = 1/6
B例子
明明人數(shù)都知道了,為什么還要繞個彎算概率芭届,那么請把場景從一個小學(xué)的一年級轉(zhuǎn)換為某個大飯店的門口储矩,我們根據(jù)以往數(shù)據(jù)感耙,可以計算出:
所有來吃飯的所有客人中,會有10%的人喝酒—— P(B)椰苟,
所有客人中抑月,會有20%的人駕車前來—— P(A),
開車來的客人中舆蝴,會有5%喝酒—— P(B|A)。
那么請問题诵,在這個飯店喝過酒的人里洁仗,仍然會開車的比例—— P(A|B)是多少?
P(A|B) = P(B|A) * P(A)/P(B) ==> P(A|B) = ?5% * 20% / 10% ?= 10%
所謂的貝葉斯方法源于托馬斯·貝葉斯(Thomas Bayes)生前為解決一個“逆概”問題寫的一篇文章性锭,而這篇文章是在他死后才由他的一位朋友發(fā)表出來的赠潦。
在貝葉斯寫這篇文章之前,人們已經(jīng)能夠計算“正向概率”草冈,如“假設(shè)袋子里面有N個白球她奥,M個黑球,你伸手進去摸一把怎棱,摸出黑球的概率是多大”哩俭。而一個自然而然的問題是反過來:“如果我們事先并不知道袋子里面黑白球的比例,而是閉著眼睛摸出一個(或好幾個)球拳恋,觀察這些取出來的球的顏色之后凡资,那么我們可以就此對袋子里面的黑白球的比例作出什么樣的推測”。這個問題谬运,就是所謂的逆概問題隙赁。
實際上,貝葉斯當時的論文只是對這個問題的一個直接的求解嘗試梆暖,并不清楚他當時是不是已經(jīng)意識到這里面包含著的深刻的思想伞访。然而后來,貝葉斯方法席卷了概率論轰驳,并將應(yīng)用延伸到各個問題領(lǐng)域厚掷,所有需要作出概率預(yù)測的地方都可以見到貝葉斯方法的影子,特別地滑废,貝葉斯是機器學(xué)習(xí)的核心方法之一蝗肪。
人工智能研究者,包括Google自動駕駛汽車的設(shè)計者蠕趁,使用貝葉斯軟件幫助及其識別模式并作出決策薛闪。根據(jù)一位流行的貝葉斯理論歷史寫作者Sharon Bertsch McGrayne所說,貝葉斯程序“挑選出電子郵件中的垃圾郵件俺陋,評估藥物和國土安全風險以及從其他東西中破譯DNA豁延£几荩”在網(wǎng)站Edge.org中,物理學(xué)家John Mather為貝葉斯機器可能已經(jīng)足夠聰明去“淘汰”人類而著急诱咏。
人們學(xué)習(xí)新的概念苔可,往往能從單一的案例中學(xué)習(xí),而機器學(xué)習(xí)則需要成千上萬的數(shù)據(jù)才能達到類似的精度袋狞。人們也可以用更豐富的方式學(xué)習(xí)概念焚辅,例如在行動、想象和解釋層面苟鸯。我們提出了一個計算模型同蜻,捕捉到人類的學(xué)習(xí)能力,為基于字母的手寫體創(chuàng)造出直觀的概念早处。在這模型背后湾蔓,研究者使用了簡單的貝葉斯程序完成。在這個具有挑戰(zhàn)性的分類任務(wù)中砌梆,貝葉斯程序戰(zhàn)勝了深度學(xué)習(xí)方法默责,達到了人類的水平。
貝葉斯定理正在變得如此流行咸包,以至于在CBS劇《生活大爆炸》中也出現(xiàn)了它的身影桃序。紐約時報說,貝葉斯統(tǒng)計學(xué)家“遍布一切诉儒,從物理學(xué)到癌癥研究葡缰,從生態(tài)學(xué)到心理學(xué)”。物理學(xué)家提出了量子機器的貝葉斯解釋忱反,以及貝葉斯捍衛(wèi)了弦和多重宇宙理論泛释。哲學(xué)家主張作為一個整體的科學(xué)可以被視為一個貝葉斯過程,還有Karl Popper普及的方法温算,貝葉斯能夠更精確地區(qū)分科學(xué)和偽科學(xué)怜校。
而就在上個月,《Nature》封面論文談到注竿,三名來自麻省理工學(xué)院茄茁、紐約大學(xué)和多倫多大學(xué)的研究者,開發(fā)了能像人類一樣學(xué)習(xí)的“寫字”系統(tǒng)巩割,其背后的原理就是貝葉斯程序裙顽。
內(nèi)行人看門道,外行人看熱鬧宣谈。如此看來愈犹,在人工智能的巨大盛大宴里,貝葉斯方法起到了舉足輕重的作用′鲈酰科學(xué)是如何改變著我們的生活的勋颖?讓我們拭目以待吧!