假設(shè)已知的訓(xùn)練數(shù)據(jù)集(最后一行是要預(yù)測(cè)的):
類別 身價(jià) 射門
贏 高 多
輸 低 少
贏 高 少
贏 低 多
輸 高 少
麦箍? 高 少
1歪今、先計(jì)算先驗(yàn)概率:
P(贏) = 3/5
P(輸) = 2/5
P(身價(jià)高|贏) = 2/3
P(射門少|(zhì)贏) = 1/3
P(身價(jià)高|輸) = 1/2
P(射門少|(zhì)輸) = 2/2
P(身價(jià)高) = 3/5
P(射門少) = 3/5
2、計(jì)算基于給定樣本的分類概率
P(贏 | 身價(jià)高,射門少)
= P(身價(jià)高|贏) * P(射門少|(zhì)贏) * P(贏) / ( P(身價(jià)高) * P(射門少) )
= 2/3 * 1/3 * 3/5 / (3/5 * 3/5)
= 10/27
P(輸 | 身價(jià)高,射門少)
= P(身價(jià)高|輸) * P(射門少|(zhì)輸) * P(輸) / ( P(身價(jià)高) * P(射門少) )
= 1/2 * 2/2 * 2/5 / (3/5 * 3/5)
= 15/27
3、判定分類, 取最大概率者
P(輸 | 身價(jià)高,射門少) > P(贏 | 身價(jià)高,射門少)
預(yù)測(cè)結(jié)果為輸
總結(jié):
所謂樸素貝葉斯,基于兩點(diǎn):
1肢专、假設(shè)所有屬性特征是相互獨(dú)立的
(這里即身價(jià)與射門屬性)
2、簡化計(jì)算
替代公式為 P(X | H) = P(X1 | H) * P(X2 | H) * ... P(Xn | H)