機器學習: 貝葉斯分類器

在機器學習的監(jiān)督學習里，貝葉斯分類器算是很有名的一個方法了，而且這個方法效果還不錯移国。

貝葉斯方程

我們先來復習一下大學里高數(shù)的貝葉斯方程

$P(A|B) = \frac{P(B|A) \times P(A)}{P(B)}$

只要記住這個方程，后面就都很容易理解了道伟。

為什么要用貝葉斯

為什么一定是貝葉斯呢迹缀？就是因為貝葉斯可以根據(jù) $P(A|B)$ 去推 $P(B|A)$ 。我們先看下面的數(shù)據(jù)集蜜徽。

現(xiàn)在你根據(jù)這個數(shù)據(jù)集去生成一個模型（現(xiàn)在還不知道怎么生成）祝懂，然后我給 $X = 0$ ，你預測 $X=0$ 時是 Bad 還是 Good拘鞋。如果用條件概率來表示應該就是求

$P(Y=Good|X=0)$

和

$P(Y=Bad|X=0)$

兩個概率砚蓬，然后比一下哪個概率大，概率大的那個就是預測值嘍~∨枭現(xiàn)在看傻眼了灰蛙，這概率我怎么求呀，一點線索沒有隔躲。OK摩梧，現(xiàn)在貝葉斯就出來求這兩個概率了，這里就求上面的概率吧蹭越。

$P(Y=Good|X=0) = \frac{P(X=0|Y=Good) \times P(Y=Good)}{P(X=0)}$

其中障本，已知 $Y=Good$ 是有 $15+287+5$ 個了，所以

$P(X=0|Y=Good) = \frac{15}{15+287+5}=\frac{15}{307}$

$P(Y=Good) = \frac{15+287+5}{15+287+5+42+338+3}=\frac{307}{690}$

$P(X=0) = \frac{42+15}{42+15+338+287+3+5}=\frac{57}{690}$

整合一下概率為

$P(Y=Good|X=0) = \frac{P(X=0|Y=Good) \times P(Y=Good)}{P(X=0)} =\frac{15}{57} \approx 0.2632$

以此類推我們把其它的概率都算出來，下面最右邊的表格就是我們對給定 X 值的預測概率驾霜，其中綠色為較高的概率案训，會分到那個類。

貝葉斯分類器就沒了粪糙，原理就是這么簡單强霎。不過，像上面使用貝葉斯在細節(jié)上會有一點問題蓉冈，下面來說說這些問題城舞。

Normalization

現(xiàn)在我們慢慢優(yōu)化上面的分類器。假設現(xiàn)在我們的特征值變成 3 個寞酿，分別是 A家夺，B，C 三個伐弹，數(shù)據(jù)集是這樣的

不錯呀拉馋，那么擼起袖子算預測值唄。但是你有沒有想到一種情況是 A惨好，B煌茴，C 對應的值是 0 呢？如下表日川。換句話說我的數(shù)據(jù)集里就沒有一項是 $A=0,B=0,C=0$ 蔓腐，那該怎么辦呢？

所以一般計算后的結果會加一個小數(shù)使其結果不為 0 就好了龄句，這個過程叫做 Normalization.

Naive Bayes

Naive Bayes 分類器應該都很耳熟了回论，它主要解決的問題是貝葉斯的計算問題。剛剛也就三個特征值撒璧，那如果再多一點那計算量就很大了透葛。公式可能寫成這樣

$P(Y=y∣F_1=f_1,…,F_k=f_k)=\max_y {\frac{P(F_1=f_1,…,F_k=f_k|Y=y) \times P(Y=y)}{P(F_1=f_1,…,F_k=f_k)}}$

而且我們不能保證所有特征值都會有對應的 $Y$ 值笨使，如有可能存在 $A_1=0,A_2=0,...A_10000=0$ 沒有對應的 $Y$ 值卿樱。那這樣就計算不了了。所以我們“大概地”硫椰，“理想化地”把所有特征值都看成是獨立的繁调，于是計算預測概率時就有

$P(F_1=f_1,…,F_k=f_k|Y=y) \approx P(F_1=f_1|Y=y) \times P(F_2=f_2|Y=y) \times ... \times P(F_k=f_k|Y=y)$

將上面的式子整理一下

$P(F_1=f_1|Y=y) \times P(F_2=f_2|Y=y) \times ... \times P(F_k=f_k|Y=y) = \prod^k_{i=1}{P(F_i=f_i|Y=y)}$

再代回原來的公式變成

$P(Y=y∣F_1=f_1,…,F_k=f_k) \approx \max_y {\frac{P(Y=y) \times \max_y {\prod^k_{i=1}{P(F_i=f_i|Y=y)}}}{P(F_1=f_1,…,F_k=f_k)}}$

因為我們只是每次對給定相同的特征值去對比預測值，所以分母是一樣的靶草，我們只需要關注分子就可以了蹄胰。因此，我們直接把分母去掉奕翔，只比較分子

$要對比的預測值 \approx P(Y=y) \times \max_y {\prod^k_{i=1}{P(F_i=f_i|Y=y)}}$

因為這只是我們假想所有特征值是獨立的裕寨，因此這個方法很 Naive，也就叫成了 Naive Bayes Classifier.

Naive Bayes vs Joint Bayes

下面通過一個例子來對比一下這兩個方法

Naive Bayes

因為特征值是獨立的，所以 $\hat{p}(x_1, x_2|y=1)$ 不是 0 而是 $\hat{p}(x_1|y=1)$ 和 $\hat{p}(x_2|y=1)$ 的乘積宾袜。

Joint Bayes

Joint Bayes 也就是之前的 Bayes 啦捻艳。這里特征值不是獨立的，而且我們找不到 $y=1$ 的條件下 $x_1=1$ 和 $x_2=1$ 同時成立的樣本庆猫，因此 $\hat{p}(x_1, x_2|y=1) = 0$ 认轨。

從上面例子可以看到，如果不用 Naive Bayes 來做月培，會出現(xiàn)預測概率為 0 的情況嘁字，這是很不好的。Naive Bayes 就可以避免這種結果杉畜，而且在實際使用中 Naive Bayes 效果還挺不錯的纪蜒，雖然它是一個估算值。

Gaussian Bayes

下面說說高斯貝葉斯分類器此叠。首先說下高斯模型霍掺，也就是正態(tài)分布模型。

這里面 $\mu$ 表示平均數(shù)拌蜘， $\sigma$ 表示方差杆烁，函數(shù)的公式是

$f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{- \frac{{(x-\mu)}^2}{2\sigma^2}}$

為什么又搞這個玩意呢？因為有些特征值是服從高斯分布的（正態(tài)分布）简卧，我們首先可以通過數(shù)據(jù)集里的特征值算出這個特征值服從高斯分布的平均值和方差兔魂，然后就得到了對應的高斯分布方程。以后在給定特征值 $F_1=f1$ 時举娩，我們就可以用這個方程去求對應的概率了析校，如下面代入 $x = f_1$ ，這里假定已經(jīng)算出 $\mu$ 和 $\sigma$

$p(F_1=f_1|Y=y)=\frac{1}{\sigma \sqrt{2\pi}}e^{- \frac{{(f_1-\mu)}^2}{2\sigma^2}}$

這樣就不用去找總數(shù)是多少铜涉，符合條件的有多少個智玻，然后再一除得到概率值。

錯誤率

最后應該要講講這個分類器的錯誤率了芙代。在分兩個種類時吊奢，一般使用下面的不等式去看屬于 1 類還是 0 類。

$p(y=0|x) < p(y=1|x)$
$p(y=0|x) > p(y=1|x)$

可視化這兩個概率會得到圖

這里有兩個相交的地方纹烹，紅色陰影表示 False Negative页滚，也就是本來應該判為 1 類的，這里判成了 0 類铺呵；藍色陰影表示 False Positive裹驰，本來應該判為 0 類，但是判成了 1 類片挂。所以我們有以下公式去算每個區(qū)域的概率

True Positive Rate: $\frac{p(y=1, \hat{y}=1)}{p(y=1)}$
False Positive Rate: $\frac{p(y=1, \hat{y}=0)}{p(y=1)}$
False Negative Rate: $\frac{p(y=0, \hat{y}=1)}{p(y=0)}$
True Negative Rate: $\frac{p(y=0, \hat{y}=0)}{p(y=0)}$

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末幻林，一起剝皮案震驚了整個濱河市贞盯，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌沪饺，老刑警劉巖邻悬，帶你破解...
沈念sama閱讀 218,386評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異随闽，居然都是意外死亡父丰，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,142評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門掘宪，熙熙樓的掌柜王于貴愁眉苦臉地迎上來蛾扇，“玉大人，你說我怎么就攤上這事魏滚《剖祝” “怎么了？”我有些...
開封第一講書人閱讀 164,704評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵鼠次，是天一觀的道長更哄。經(jīng)常有香客問我，道長腥寇，這世上最難降的妖魔是什么成翩？我笑而不...
開封第一講書人閱讀 58,702評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮赦役，結果婚禮上麻敌，老公的妹妹穿的比我還像新娘。我一直安慰自己掂摔，他們只是感情好术羔，可當我...
茶點故事閱讀 67,716評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著乙漓，像睡著了一般级历。火紅的嫁衣襯著肌膚如雪初狰。梳的紋絲不亂的頭發(fā)上纸兔，一...
開封第一講書人閱讀 51,573評論 1贊 305
城市分裂傳說
那天忌栅，我揣著相機與錄音八拱，去河邊找鬼。笑死狐胎，一個胖子當著我的面吹牛客给，可吹牛的內容都是我干的。我是一名探鬼主播皱坛，決...
沈念sama閱讀 40,314評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼豆巨！你這毒婦竟也來了剩辟？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 39,230評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎贩猎，沒想到半個月后熊户，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,680評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡吭服，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,873評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年嚷堡，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片艇棕。...
茶點故事閱讀 39,991評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡蝌戒，死狀恐怖，靈堂內的尸體忽然破棺而出沼琉，到底是詐尸還是另有隱情北苟，我是刑警寧澤，帶...
沈念sama閱讀 35,706評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布打瘪，位于F島的核電站友鼻，受9級特大地震影響，放射性物質發(fā)生泄漏闺骚。R本人自食惡果不足惜彩扔，卻給世界環(huán)境...
茶點故事閱讀 41,329評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望僻爽。院中可真熱鬧借杰，春花似錦、人聲如沸进泼。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,910評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽乳绕。三九已至绞惦，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間洋措，已是汗流浹背济蝉。一陣腳步聲響...
開封第一講書人閱讀 33,038評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留菠发，地道東北人王滤。一個月前我還...
沈念sama閱讀 48,158評論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像滓鸠，于是被迫代替她去往敵國和親雁乡。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,941評論 2贊 355

機器學習: 貝葉斯分類器

貝葉斯方程

為什么要用貝葉斯

Normalization

Naive Bayes

Naive Bayes vs Joint Bayes

Naive Bayes

Joint Bayes

Gaussian Bayes

錯誤率

推薦閱讀更多精彩內容