- 關(guān)于貝葉斯布疼,參見https://www.bilibili.com/video/BV1R7411a76r/?spm_id_from=333.788.videocard.0
3Blue1Brown頻道的許多關(guān)于數(shù)學(xué)的內(nèi)容都深入簡出走越,基于它們開發(fā)的一個python庫城舞。
貝葉斯公式
貝葉斯公式實(shí)際表達(dá)即是,在某事件發(fā)生的條件下楷力,另一個事件發(fā)生的概率言蛇。
直觀的理解貝葉斯公式
當(dāng)我們判斷一個溫和而有涵養(yǎng)的人
是什么職業(yè)的時候,我們可能更相信他是一個圖書館員
笆包,而并非一個農(nóng)民
环揽。
但數(shù)據(jù)告訴我們,圖書館員
相比農(nóng)民
庵佣,在人群中所占的比重非常小歉胶。(假設(shè)圖書館員
比農(nóng)民
為1:20)
因此某些直覺的判斷可能違背理性。理性不代表知道事實(shí)巴粪,而是認(rèn)識到哪些因素是有關(guān)的通今。
-
假設(shè)有10個圖書館員粥谬,對應(yīng)200個農(nóng)民。
當(dāng)我們聽到關(guān)于
溫和而有涵養(yǎng)的人
的描述后辫塌,直覺告訴我們有40%的可能他是圖書館員漏策,而10%的可能他是農(nóng)民。-
因此我們可以得到預(yù)計(jì)的相應(yīng)總體中的人數(shù)臼氨。
-
并且可以得到判斷在該樣本大小寫掺喻,符合該描述的圖書館員所占的比重。
貝葉斯公式的核心思想
新證據(jù)并不能直接憑空決定你的看法储矩,而是應(yīng)該更新你之前的看法感耙。
貝葉斯公式的數(shù)學(xué)表達(dá)
目標(biāo)結(jié)果
|
之前的內(nèi)容為之后內(nèi)容的限制因素,即 hypothesis 的概率是在符合E 的基礎(chǔ)之上得到的持隧。
先驗(yàn)概率 prior
圖書館員所占總數(shù)的比為
10:(10 + 200)
似然概率 likelihood
假設(shè)為圖書館員的條件下即硼,符合角色描述的概率。
假設(shè)為農(nóng)民的條件下屡拨,符合角色描述的概率只酥。(H 之前的符號表示為
非
)
后驗(yàn)概率 posterior
首先可以約去上下的人數(shù),接著可以將分母內(nèi)容用P(E)
表示呀狼,代表看到所有證據(jù)的概率(即所有假設(shè)下的所有符合證據(jù)的個數(shù))层皱。
總結(jié)
我們可以將任何事件都對應(yīng)概率空間的一個子集(一個1X1 的正方形),概率的大小可以通過劃分正方形的面積來表示赠潦。
貝葉斯公式的延展
這里再引入之前的圖書館員和農(nóng)民的例子叫胖,再加一個商人。
可以理解成在某個先驗(yàn)概率情況下她奥,分割長方形(先驗(yàn)概率瓮增,農(nóng)民、商人哩俭、圖書館員占其總?cè)巳旱谋壤┍僚堋T賹﹂L方形根據(jù)似然概率的描述,得到具體的面積(符合某種描述的人群的概率)凡资。其中符合特定要求(圖書館員)的特定描述的面積所占全部(農(nóng)民砸捏、商人、圖書館員概率之和)的符合特定描述的面積的比例隙赁,即為該特定描述下特定要求(圖書館員)所占的比例垦藏。