《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》讀書(shū)筆記4

樸素貝葉斯算法概述

簡(jiǎn)單的說(shuō)仙畦,樸素貝葉斯算法是基于概率論的分類(lèi)方法慨畸。有時(shí)候衣式,使用概率進(jìn)行分類(lèi)比使用硬規(guī)則進(jìn)行分類(lèi)更為有效。

優(yōu)點(diǎn):在數(shù)據(jù)較少的情況下仍然有效弱卡,可以處理多類(lèi)別問(wèn)題。
缺點(diǎn):對(duì)于輸入數(shù)據(jù)的準(zhǔn)備方式較為敏感住册。
適用數(shù)據(jù)類(lèi)型:標(biāo)稱(chēng)型數(shù)據(jù)婶博。

入門(mén)案例

從一個(gè)例子開(kāi)始講起,你會(huì)看到樸素貝葉斯分類(lèi)很好懂荧飞,一點(diǎn)都不難凡人。

某個(gè)醫(yī)院早上收了6個(gè)門(mén)診病人,診斷結(jié)果如下表:
現(xiàn)在又來(lái)了第七個(gè)病人叹阔,是一個(gè)“打噴嚏的工人” 挠轴,請(qǐng)問(wèn)他可能患了什么病条获?

解答上面的問(wèn)題忠荞,應(yīng)計(jì)算“打噴嚏的工人”患上各種疾病的概率帅掘,然后取概率最大的最為結(jié)論委煤。怎么計(jì)算概率,就要用到“樸素貝葉斯”定理修档,其公式如下:(本文并不討論怎么證明該公式)

P(A | B) = P(B | A) * P(A) / P(B)
其中碧绞,P(A | B)的解讀為:B中出現(xiàn)A的概率。

根據(jù)該公式吱窝,我們先計(jì)算“打噴嚏的工人患感冒的概率”讥邻,如下:

P(感冒 | 打噴嚏的工人) = P(打噴嚏的工人 | 感冒) * P(感冒) / P(打噴嚏的工人)

根據(jù)上面的公式,我們?nèi)匀粺o(wú)法從統(tǒng)計(jì)數(shù)據(jù)中得到“P(打噴嚏的工人 | 感冒)”院峡,即:感冒癥狀中兴使,打噴嚏的工人的概率。但“樸素貝葉斯”假定特征之間是獨(dú)立的照激,即:“打噴嚏”和“工人”這兩個(gè)特征是獨(dú)立的发魄,那么上面的等式就變成了:

P(感冒 | 打噴嚏的工人)
= P(打噴嚏 | 感冒) *?P(工人 | 感冒) *?P(感冒) /?P(打噴嚏) *?P(工人)
= (2/3) * (1/3) * (3/6) / (3/6) * (2/6)
=0.66 * 0.33 * 0.5 / 0.5 * 0.33
=0.66

因此,這個(gè)打噴嚏的工人得了感冒的概率是66%。同理励幼,可以計(jì)算這個(gè)病人患上過(guò)敏或腦震蕩的概率汰寓。比較這幾個(gè)概率,就可以知道他最可能得什么病苹粟。

工作原理

貝葉斯概率準(zhǔn)則提供了一種利用已知概率來(lái)估算未知概率的有效方法有滑,即:在統(tǒng)計(jì)資料的基礎(chǔ)上,依據(jù)某些特征嵌削,計(jì)算各個(gè)分類(lèi)的概率毛好,取最大概率作為分類(lèi)的依據(jù)。

可以通過(guò)特征之間的“條件獨(dú)立性假設(shè)” 苛秕,降低對(duì)數(shù)據(jù)量以及計(jì)算復(fù)雜度的需求睛榄。什么是“條件獨(dú)立性假設(shè)” ?如上面的例子“打噴嚏”和“工人”就確實(shí)是獨(dú)立的特征想帅,它們沒(méi)有必然聯(lián)系。但某些情況下并非如此啡莉,如:一個(gè)詞出現(xiàn)在文章中的概率可能會(huì)受其它詞的影響港准,但我們?nèi)约僭O(shè)它并不依賴(lài)于其它詞。雖然我們知道這個(gè)假設(shè)過(guò)于簡(jiǎn)單咧欣、樂(lè)觀浅缸,但這就是之所以稱(chēng)為“樸素貝葉斯”的原因。盡管“條件獨(dú)立性假設(shè)”并不完全準(zhǔn)確魄咕,但是樸素貝葉斯仍然是一種有效的分類(lèi)器衩椒。

一般流程

1.收集數(shù)據(jù):可以使用任何方法;
2.準(zhǔn)備數(shù)據(jù):需要數(shù)值型或者布爾型數(shù)據(jù)哮兰;
3.分析數(shù)據(jù):確保解析的正確性毛萌;
4.訓(xùn)練算法:計(jì)算不同的獨(dú)立特征的條件概率;
5.測(cè)試算法:計(jì)算錯(cuò)誤率喝滞;
6.使用算法:可以在任意的分類(lèi)器場(chǎng)景中適用樸素貝葉斯分類(lèi)器阁将。

可使用場(chǎng)景

1.郵件分類(lèi),如攔截垃圾郵件右遭;
2.新聞分類(lèi)做盅,如對(duì)爬來(lái)的網(wǎng)頁(yè)內(nèi)容歸類(lèi);
……

同類(lèi)筆記可點(diǎn)擊這里查閱

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末窘哈,一起剝皮案震驚了整個(gè)濱河市吹榴,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌滚婉,老刑警劉巖图筹,帶你破解...
    沈念sama閱讀 218,122評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異满哪,居然都是意外死亡婿斥,警方通過(guò)查閱死者的電腦和手機(jī)劝篷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)民宿,“玉大人娇妓,你說(shuō)我怎么就攤上這事』钣ィ” “怎么了哈恰?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,491評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)志群。 經(jīng)常有香客問(wèn)我着绷,道長(zhǎng),這世上最難降的妖魔是什么锌云? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,636評(píng)論 1 293
  • 正文 為了忘掉前任荠医,我火速辦了婚禮,結(jié)果婚禮上桑涎,老公的妹妹穿的比我還像新娘彬向。我一直安慰自己,他們只是感情好攻冷,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布娃胆。 她就那樣靜靜地躺著,像睡著了一般等曼。 火紅的嫁衣襯著肌膚如雪里烦。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,541評(píng)論 1 305
  • 那天禁谦,我揣著相機(jī)與錄音胁黑,去河邊找鬼。 笑死州泊,一個(gè)胖子當(dāng)著我的面吹牛别厘,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播拥诡,決...
    沈念sama閱讀 40,292評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼触趴,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了渴肉?” 一聲冷哼從身側(cè)響起冗懦,我...
    開(kāi)封第一講書(shū)人閱讀 39,211評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎仇祭,沒(méi)想到半個(gè)月后披蕉,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,655評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評(píng)論 3 336
  • 正文 我和宋清朗相戀三年没讲,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了眯娱。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,965評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡爬凑,死狀恐怖徙缴,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情嘁信,我是刑警寧澤于样,帶...
    沈念sama閱讀 35,684評(píng)論 5 347
  • 正文 年R本政府宣布,位于F島的核電站潘靖,受9級(jí)特大地震影響穿剖,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜卦溢,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評(píng)論 3 329
  • 文/蒙蒙 一糊余、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧单寂,春花似錦啄刹、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,894評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)袱讹。三九已至疲扎,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間捷雕,已是汗流浹背椒丧。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,012評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留救巷,地道東北人腥刹。 一個(gè)月前我還...
    沈念sama閱讀 48,126評(píng)論 3 370
  • 正文 我出身青樓朝群,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子歇盼,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容