貝葉斯公式轻要、樸素貝葉斯

在簡書的第一篇博客复旬、作為總結(jié)機器學習的開始,網(wǎng)上已經(jīng)有了很多關(guān)于貝葉斯公式以及樸素貝葉斯的資料冲泥,但我還是想自己記錄一下自己學習過程中的一些要點驹碍。

一 貝葉斯公式:

在學習貝葉斯公式之前,先了解幾個定義:

1.邊緣概率(又稱先驗概率): 某個事件發(fā)生的概率凡恍。邊緣概率是這樣得到的:在聯(lián)合概率中志秃,把最終結(jié)果中那些不需要的事件通過合并成它們的全概率,而消去它們(對離散隨機變量用求和得全概率咳焚,對連續(xù)隨機變量用積分得全概率)洽损,這稱邊緣化,如事件A的邊緣概率為P(A)革半,B的邊緣概率表示為P(B)碑定。

2.聯(lián)合概率:表示為兩個事件共同發(fā)生的概率流码。A與B的聯(lián)合概率表示為P(A\cap B)或者P(A,B)延刘。

3.條件概率(又稱為后驗概率):事件A在另外一個事件B已經(jīng)發(fā)生的情況下發(fā)生的概率漫试。條件概率表示為P(A|B),表示為在B條件下A的概率碘赖。

貝葉斯公式:

在網(wǎng)上發(fā)現(xiàn)一個比較恰當例子來解釋這個公式:

有甲驾荣、乙兩條生產(chǎn)線,甲生產(chǎn)線的產(chǎn)品合格率為90%普泡,乙生產(chǎn)線的產(chǎn)品合格率為95%播掷,兩條生產(chǎn)線的生產(chǎn)量占比分別為30%和70%,現(xiàn)在發(fā)現(xiàn)了一件不合格品撼班,判斷這個不合格品是甲生產(chǎn)線生產(chǎn)出來的概率歧匈? 假設(shè)現(xiàn)在生產(chǎn)出來的產(chǎn)品總量為1000個,如圖中所示砰嘁,甲乙生產(chǎn)線的產(chǎn)量分別是300和700個件炉,則不合格品分別為30和35個


現(xiàn)用A表示生產(chǎn)不合格品事件, B1、B2分別表示甲乙兩條生產(chǎn)線


推導:

不合格品總數(shù) = 甲不合格數(shù)量 + 乙不合格數(shù)量 = 總產(chǎn)量X甲產(chǎn)量占比X甲不合格率 + 總產(chǎn)量X乙產(chǎn)量占比X乙不合格率 = 總產(chǎn)量XP(B1)XP(A|B1) + 總產(chǎn)量XP(B2)XP(A|B2)

P(甲|不合格) = P(B1|A) =\frac{甲不合格數(shù)}{不合格總數(shù)} =\frac{總產(chǎn)量\times P(B1)\times P(A|B1)}{總產(chǎn)量\times P(B1)\times P(A|B1) + 總產(chǎn)量\times P(B2)\times P(A|B2)}

得到:?

P(B1|A) = \frac{P(B1)\times P(A|B1)}{P(B1)\times P(A|B1) + P(B2)\times P(A|B2)}?

假設(shè)為n條生產(chǎn)線則有:?P(Bi|A) =\frac{P(Bi)\times P(A|Bi)}{\sum\nolimits_{j=1}^n P(Bj)\times P(A|Bj)}

單變量條件概率推導

根據(jù)條件概率的定義矮湘,在事件B發(fā)生的條件下事件A發(fā)生的概率為:

P(A|B) = \frac{P(AB)}{P(B)}

事件A發(fā)生的條件下事件B的概率為:

P(B|A) = \frac{P(AB)}{P(A)}

綜合上述兩個式子得到:

P(B|A)P(A) = P(A|B)P(B) \Leftrightarrow P(A|B) = \frac{P(B|A)P(A)}{P(B)}

二 樸素貝葉斯

先簡單介紹幾個名詞的概念

樸素貝葉斯:NaiveBayes

樸素:特征條件獨立

貝葉斯:基于貝葉斯定理

屬于監(jiān)督學習的生成模型斟冕,實現(xiàn)簡單,并沒有迭代缅阳,有貝葉斯理論作為支撐磕蛇。

我們先看一個例子然后在看理論

(1)病人分類


某個醫(yī)院早上收了六個病人,如上圖券时,現(xiàn)在又來了第七個病人孤里,是一個身上發(fā)熱的建筑工人,請問他換上感冒的概率有多大橘洞?

根據(jù)貝葉斯定理:

P(A|B) = \frac{P(B|A)P(A)}{P(B)}

P(感冒|發(fā)熱\times 建筑工人) = \frac{P(發(fā)熱\times 建筑工人|感冒)P(感冒)}{P(發(fā)熱\times 建筑工人)}

假設(shè)“發(fā)熱”和“建筑工人”這個兩個屬性是獨立的捌袜,因此,上式可化為

P(感冒|發(fā)熱\times 建筑工人) = \frac{P(發(fā)熱|感冒)P(建筑工人|感冒)P(感冒)}{P(發(fā)熱\times 建筑工人)}

通過已有數(shù)據(jù)可算出上式結(jié)果為0.66,因此這個發(fā)熱建筑工人有0.66的概率得了感冒炸枣。同理可以算出這個病人患上過敏或腦震蕩的概率虏等。比較這幾個概率得到最大值,可以知道他最有可能得什么病

(2)理論


這段內(nèi)容來自韓家煒先生的書《數(shù)據(jù)挖掘:概念與技術(shù)》第351頁:

解釋下,其中訓練元組可以理解為訓練的樣本适肠,上文例子中每一個病人樣本霍衫,x1~xn可以表示為n個屬性,A1~An可以理解為屬性值,C1~Cn可以理解為有多少種疾病分類,其中的不等式表示求該算式最大值,繼續(xù)看書有

可以看到一個關(guān)鍵的要點,為了計算P(X|Ci)假設(shè)類條件獨立的樸素嘉定,對應(yīng)我們在病人分類的例子里計算概率所使用的方法侯养,假設(shè)條件獨立后敦跌,計算復雜度降低了幾個數(shù)量級,同時根據(jù)樣本計算獨立的概率還是很容易的,這也是樸素貝葉斯的由來柠傍,可以說貝葉斯和樸素貝葉斯的最大區(qū)別就在‘樸素’上即條件獨立麸俘,引入樸素貝葉斯的目的是為了降低計算量

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市惧笛,隨后出現(xiàn)的幾起案子从媚,更是在濱河造成了極大的恐慌,老刑警劉巖患整,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件拜效,死亡現(xiàn)場離奇詭異,居然都是意外死亡各谚,警方通過查閱死者的電腦和手機紧憾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來昌渤,“玉大人稻励,你說我怎么就攤上這事∮” “怎么了?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵加矛,是天一觀的道長履婉。 經(jīng)常有香客問我,道長斟览,這世上最難降的妖魔是什么毁腿? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任,我火速辦了婚禮苛茂,結(jié)果婚禮上已烤,老公的妹妹穿的比我還像新娘。我一直安慰自己妓羊,他們只是感情好胯究,可當我...
    茶點故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著躁绸,像睡著了一般裕循。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上净刮,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天剥哑,我揣著相機與錄音,去河邊找鬼淹父。 笑死株婴,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的暑认。 我是一名探鬼主播困介,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼大审,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了逻翁?” 一聲冷哼從身側(cè)響起饥努,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎八回,沒想到半個月后酷愧,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡缠诅,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年溶浴,在試婚紗的時候發(fā)現(xiàn)自己被綠了坷檩。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片折晦。...
    茶點故事閱讀 38,809評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖俘枫,靈堂內(nèi)的尸體忽然破棺而出褥伴,到底是詐尸還是另有隱情谅将,我是刑警寧澤,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布重慢,位于F島的核電站饥臂,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏似踱。R本人自食惡果不足惜隅熙,卻給世界環(huán)境...
    茶點故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望核芽。 院中可真熱鬧囚戚,春花似錦、人聲如沸轧简。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽吉懊。三九已至庐橙,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間借嗽,已是汗流浹背态鳖。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留恶导,地道東北人浆竭。 一個月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親邦泄。 傳聞我的和親對象是個殘疾皇子删窒,可洞房花燭夜當晚...
    茶點故事閱讀 43,724評論 2 351