在第二次世界大戰(zhàn)期間浆兰,同盟國試圖估計納粹德國制造的坦克數(shù)量雨饺。盟軍采取了兩種方法:一是根據(jù)情報人員刺探的消息而得到荐吉,另一種是根據(jù)盟軍發(fā)現(xiàn)和截獲的德國坦克數(shù)據(jù)对省,用統(tǒng)計分析辦法得到蝗拿。
戰(zhàn)后事實證明數(shù)學(xué)家成功預(yù)測德國坦克數(shù)量,比間諜活動還要準確官辽,而科學(xué)家運用的正是貝葉斯方法蛹磺。?
那什么是貝葉斯方法呢粟瞬?貝葉斯方法又叫貝葉斯推理同仆,是一種更新既有判斷的方法,其公式翻譯成“中文”大概就是這個樣子:
后驗概率=似然比×先驗概率
這個公式有兩個要點: 首先有一個對既有事實的判斷(先驗概率)裙品;其次還要有獲得新信息后的“判別值”(似然比)俗批,然后依賴這兩個要素不斷調(diào)整,更新得到最終的結(jié)果(后驗概率)市怎。
這么說有點抽象岁忘,其實我們每個人生活中都在用旦委,不論超市排隊付款猫妙,還是在網(wǎng)上購買新品手機,不管我們有沒有學(xué)過“貝葉斯公式”倦畅,我們都在用簡單的貝葉斯推理對隨后的行動進行相應(yīng)的評判和反應(yīng)。
就拿超市排隊付款來說麻汰,我們都會習(xí)慣性的先觀察每個隊伍的排隊情況速客,其次對比每個隊伍的人數(shù)多少,最后根據(jù)隊伍的人數(shù)決定自己該到哪個隊伍去排隊五鲫,這個排隊的步驟已經(jīng)有一點貝葉斯的意味了溺职,當(dāng)然排隊事實上實際情況比這還要復(fù)雜,還要考慮到很多其它因素位喂,諸如隊伍里其它顧客購買的商品數(shù)量浪耘,收銀員的熟練性等等。真實世界的排隊學(xué)塑崖,就需要全面考慮這些相關(guān)因素七冲,這些信息越準確,我們得到的結(jié)論也就會越準確规婆。
貝葉斯方法當(dāng)然不僅僅適用于此癞埠,它幾乎可以適用于各種各樣的預(yù)測問題,因此毫不夸張地說聋呢,它能成為指導(dǎo)我們決策的一大神器苗踪。
我在上次自己的文章中舉了個例子,阿里巴巴的聯(lián)合創(chuàng)始人不建議別人學(xué)他們削锰,某種程度上通铲,也可以說那些學(xué)習(xí)者是犯了貝葉斯方法上的錯誤。首先他們錯誤的估計了自己的“實力”器贩,自己的“生態(tài)”和阿里的“生態(tài)”是兩種截然不同的“生態(tài)”颅夺。(這些都是先驗概率上的錯誤)第一步定位失誤,就造成了后面的判別值越“相似”蛹稍,最后的結(jié)果越懸殊(后驗概率的差別越大)吧黄。因為創(chuàng)業(yè)又是一件成本極高的是,他們難以重復(fù)去實踐唆姐,缺少反饋拗慨,成功的概率也就被鎖死了。
所以預(yù)測的第一個要點奉芦,找先驗概率赵抢。遇到問題的時候,你要先分解問題声功。分解問題之后烦却,我們就能知道,什么是已知的信息先巴,什么是未知的信息其爵。然后有針對性的去應(yīng)對冒冬。但務(wù)必要注意,這些所有的信息摩渺,都來自于“自己的”感知先驗窄驹,簡而言之,先驗概率初始都是主觀的证逻。
我們知道要想得到相對精確的結(jié)果乐埠,就要不斷提升先驗概率的準確性。主觀的先驗概率囚企,能帶來客觀的結(jié)果丈咐,怎么看怎么像不靠譜的事×辏可貝葉斯方法偏偏依靠不斷調(diào)試不斷優(yōu)化的結(jié)果棵逊,去豐富和完善新的先驗概率,再由此去得到更加“準確”的結(jié)果银酗。在不受“黑天鵝”影響的地方辆影,這符合因果相關(guān)性,貝葉斯方法自然而然成為當(dāng)之無愧的實踐經(jīng)驗哲學(xué)黍特,是“實踐是檢驗真理的唯一標準”的完美代言蛙讥。
這個世界有太多的事與愿違,有太多人就算事實已經(jīng)發(fā)生灭衷,仍在質(zhì)疑事實的正確次慢;太多人固執(zhí)己見,忽視證據(jù)的存在翔曲。這也是普通人利用貝葉斯方法最難的地方迫像,如何改變先入為主的主觀偏見,愿意接受現(xiàn)實瞳遍,重新改變對事實的觀點闻妓,是我們學(xué)會貝葉斯思考最最關(guān)鍵的一步,不斷在動態(tài)中找到平衡掠械,很有哲學(xué)的意味由缆,可以說是貝葉斯思考的精髓。在這個世界充滿不確定性份蝴,我們只能利用有限的證據(jù)犁功,拼湊一個盡可能完整的判斷氓轰,和不確定的世界進行一場至死方休的博弈婚夫。
思緒至此,不由得想到魯迅那句話——真正的勇士署鸡,敢于直面慘淡的人生案糙,敢于正視淋漓的鮮血限嫌。活著时捌,誰不是呢怒医?
參考資料
German tank problem - Wikipedia
《超預(yù)算》菲利普·泰洛克? 丹·加德納
《指導(dǎo)生活的算法》布萊恩·克里斯汀? 湯姆·格里菲斯