貝葉斯公式 + 條件獨立假設(shè) = 樸素貝葉斯方法
$$
P(Y|X)=\frac{P(X|Y)}{P(X)}
$$
其中P(Y)叫做先驗概率挤悉,P(Y|X)叫做后驗概率白胀,P(Y,X)叫做聯(lián)合概率叽掘。
1. P(“屬于某類”|“具有某特征”)=在已知某樣本“具有某特征”的條件下鲁纠,該樣本“屬于某類”的概率赌蔑。所以叫做『后驗概率』悯周。
2. P(“具有某特征”|“屬于某類”)=在已知某樣本“屬于某類”的條件下拌蜘,該樣本“具有某特征”的概率杆烁。
3. P(“屬于某類”)=(在未知某樣本具有該“具有某特征”的條件下,)該樣本“屬于某類”的概率简卧。所以叫做『先驗概率』连躏。
4. P(“具有某特征”)=(在未知某樣本“屬于某類”的條件下,)該樣本“具有某特征”的概率贞滨。
由于計算時具有某特征而屬于某類無法直接通過統(tǒng)計得到入热,比如有十個屬性而求相應(yīng)類概率是比較復(fù)雜的拍棕,但是反過來求對應(yīng)類會有那些屬性概率則可以通過統(tǒng)計得到,因此需要用到上面所說的概率公式將其轉(zhuǎn)換勺良。當(dāng)然樸素貝葉斯算法有個更加強的假設(shè)绰播,就是屬性間相互獨立,也就是概率可以進行相乘:
$$
P(v_1,\cdots,v_n|x_k)=\Pi P(v_i|x_k)
$$
當(dāng)特征屬性為連續(xù)值時尚困,通常假定其值服從高斯分布(也稱正態(tài)分布)