樸素貝葉斯 是一種基于概率理論的分類算法,以貝葉斯理論為理論基礎(chǔ)宇植,通過計算樣本歸屬于不同類別的概率來進行分類——經(jīng)典的分類算法。
what is bayesian theory?
貝葉斯理論——基于所能獲得的最好證據(jù)(觀察疾捍、數(shù)據(jù)、信息等)栏妖,計算亞型信念度(假說/主張/命題)的有效方法乱豆。信念度指的是:對事物的真實性和正確性所具有的信心。
樸素:單純的吊趾、粗糙的假設(shè)觀測值之間是相互獨立的宛裕。
貝葉斯公式中,P(A)稱為"先驗概率"论泛,即在B事件發(fā)生之前揩尸,對A事件概率的一個判斷。
P(A|B)稱為"后驗概率"屁奏,即在B事件發(fā)生之后岩榆,對A事件概率的重新評估。
P(B|A)/P(B)稱為"可能性函數(shù)"了袁,這是一個調(diào)整因子朗恳,使得預(yù)估概率更接近真實概率。
所以载绿,條件概率可以理解成下面的式子:后驗概率=先驗概率x調(diào)整因子粥诫。
原理圖
優(yōu)缺點