? ? ??通常,事件A在事件B的條件下的概率码俩,與事件B在事件A的條件下的概率是不一樣的;然而歼捏,這兩者是有確定的關(guān)系稿存,貝葉斯法則就是這種關(guān)系的陳述笨篷。:.
? ??樸素貝葉斯方法時基于貝葉斯定理和特征條件獨立假設(shè)的分類方法。對于給定的訓(xùn)練數(shù)據(jù)集瓣履,首先基于特征條件獨立假設(shè)學(xué)習(xí)輸入與輸出的聯(lián)合概率分布率翅;然后基于此模型,對于給定輸入x,利用貝葉斯定理求出后驗概率最大的輸出y袖迎。損失函數(shù)為對數(shù)似然損失冕臭。顯然,樸素貝葉斯分類器的學(xué)習(xí)過程就是根據(jù)訓(xùn)練集D來估計類先驗概率P(c)燕锥,并為每個屬性估計條件概率
? ??其參數(shù)估計方法為最大似然估計(最大似然估計:現(xiàn)在已經(jīng)拿到了很多個樣本(你的數(shù)據(jù)集中所有因變量)辜贵,這些樣本值已經(jīng)實現(xiàn),最大似然估計就是去找到那個(組)參數(shù)估計值脯宿,使得前面已經(jīng)實現(xiàn)的樣本值發(fā)生概率最大。因為你手頭上的樣本已經(jīng)實現(xiàn)了泉粉,其發(fā)生概率最大才符合邏輯连霉。)
????樸素貝葉斯為什么樸素:樸素貝葉斯默認(rèn)各個屬性是同等重要的,最簡單嗡靡、最樸素的假設(shè)跺撼,所以是樸素貝葉斯。
????通常讨彼,事件A在事件B的條件下的概率歉井,與事件B在事件A的條件下的概率是不一樣的;然而哈误,這兩者是有確定的關(guān)系哩至,貝葉斯法則就是這種關(guān)系的陳述。P(A|B)=P(B|A)*P(A)/P(B)
? ? 主要應(yīng)用:
? ??????應(yīng)用:
????????垃圾郵件過濾
????????輸入法推薦(在一個簡單輸入過程中應(yīng)用了很多機器學(xué)習(xí)算法蜜自,如輸入wo shi zhongguoren菩貌,通過隱馬爾可夫模型得出結(jié)論我是中國人,然后根據(jù)樸素貝葉斯模型推薦之后內(nèi)容為我愛五星紅旗)
????樸素貝葉斯模型由于其較強的特征條件獨立性假設(shè)重荠,使得模型參數(shù)極大的減少箭阶。同時也由于該假設(shè),使得他在一些特征關(guān)聯(lián)性比較強的模型中表現(xiàn)不佳戈鲁。