為什么叫樸素貝葉斯分類呢氮兵?
1.它用到了貝葉斯定理
2.這種方法的思想真的很樸素??
對于給出的待分類項仙畦,求解在此項出現(xiàn)的條件下各個類別出現(xiàn)的概率裸准,哪個最大脚乡,就認(rèn)為此待分類項屬于哪個類別替劈。你在街上看到一個黑人寄雀,你很可能會猜非洲。因為黑人中非洲人的比率最高陨献,當(dāng)然也不一定對盒犹。但在沒有其它可用信息下,我們會選擇條件概率最大的類別,這就是樸素貝葉斯的思想基礎(chǔ)阿趁。
舉個栗子??:
用cu膜蛔,fe,ca三種元素的含量判斷某人是否患病脖阵。
可以先統(tǒng)計1000人的患病情況皂股,并測出他們的三種元素含量。
若其中400人患病命黔,那p(患参啬拧)=0.4,p(健康)=0.6
患病的400人中:
p(cu>0.1)=0.8,?p(cu<0.1)=0.2,
p(fe>0.1)=0.7, ?p(fe<0.1)=0.3,
p(ca>0.1)=0.6,?p(ca>0.1)=0.4,
健康的600人中:
p(cu>0.1)=0.3,?p(cu<0.1)=0.7,
p(fe>0.1)=0.2, ?p(fe<0.1)=0.8,
p(ca>0.1)=0.1,?p(ca<0.1)=0.9,
那么我們就可以計算其他人的患病概率了:
加入一個人cu悍募,fe蘑辑,ca三種元素含量分別為0.12,0.8坠宴,0.7
那他的p(患惭蠡辍)=0.4*0.8*0.3*0.4=0.0384
p(健康)=0.6*0.3*0.8*0.9=0.1296
可以看出,他的p(健康)明顯大于p(患蚕补摹)副砍,所以很可能是健康的