之前一節(jié)霹琼,講了線性回歸的一些理解, 其實傳統(tǒng)的機器學(xué)習(xí)方法冤留,和線性回歸或多或少都有關(guān)系碧囊。
線性回歸有三個特點树灶, 線性纤怒,全局性, 數(shù)據(jù)未加工天通, 我們依次來看這個問題泊窘。
(1)線性方面
a.屬性線性,f(x) 和 x各個特征是線性關(guān)系像寒,例如f(x) = w1 * x1 + w2 *x2, 當(dāng)屬性線性不滿足的時候烘豹,就引入特征轉(zhuǎn)換了,例如多項式回歸模型诺祸。
b.全局線性携悯,f(x)只是一個線性組合,然后就直接輸出了結(jié)果筷笨,我們可以在線性方程后面加入一個非線性變換憔鬼,即引入一個非線性的激活函數(shù)龟劲,就可以得到新的模型,典型的有線性分類模型如感知機轴或,邏輯斯蒂回歸等
c.系數(shù)線性昌跌,f關(guān)于w也是線性的,系數(shù)本身不可能是多次的照雁,這個概念蚕愤,指的是對于模型而言,不同系數(shù)初始值下饺蚊,系數(shù)是會變化的萍诱,例如神經(jīng)網(wǎng)絡(luò),感知機污呼。
(2)全局性方面砂沛,最簡單的線性回歸,擬合出一條直線曙求,在整個特征空間上都是統(tǒng)一的碍庵。可以在不同區(qū)域引入不同的線性或非線性關(guān)系悟狱,打破全局性静浴,例如決策樹模型,線性樣條回歸
(3)原始數(shù)據(jù)方面挤渐,直接拿來做回歸苹享,沒有進行任何數(shù)據(jù)加工,例如維度高了可以進行PCA降維等浴麻。
其他的模型得问,其實就是在打破線性回歸這些特點中的一個或多個,這就構(gòu)建起了整個統(tǒng)計機器學(xué)習(xí)的架構(gòu)软免。
今天我們主要講線性分類宫纬,可以看到它是打破了線性回歸中的全局線性特點。
?線性分類可以分為兩大類膏萧,(1)硬分類 (2)軟分類漓骚。
簡單來說,硬分類就是直接給出label是0還是1的榛泛,軟分類給的是[0,1]的概率蝌蹂。
硬分類比如 線性判別分析(fisher判別分析),感知機等曹锨。
軟分類里可以繼續(xù)分為 生成式(例如樸素貝葉斯(離散變量)孤个, 高斯判別分析(連續(xù)變量))和 判別式(邏輯回歸),生成式和判別式的區(qū)別在于沛简,判別式是直接求概率的齐鲤,而生成式是求聯(lián)合概率的」杓保現(xiàn)在看可能有點暈,等碰到生成式的時候可能更好理解佳遂。
今天我們首先講邏輯斯蒂回歸营袜,雖然名字里是回歸,但它是一個分類模型丑罪, 是不滿足全局線性下的回歸演變而來荚板。簡單起見,我們先討論二分類問題吩屹。
首先介紹一下激活函數(shù) sigmoid函數(shù)?
把激活函數(shù)和線性回歸結(jié)合起來跪另,?
首先來理解一下為什么sigmoid可以用來分類, 其實就是label為1的概率煤搜,當(dāng)
的取值為0 的時候已烤, 值是0.5稽荧, 當(dāng)
越大娄涩, 值越接近1系忙,可以認(rèn)為label是1 的概率越大。
,?
回顧一下上一講的內(nèi)容迹卢,對于統(tǒng)計機器模型辽故,定義了模型了之后,第二步就是定義損失函數(shù)了腐碱。
我們從最大似然角度出發(fā)誊垢,?
這個式子乍一看比較難理解, 其實在yi=1的時候症见,只留下前一項了喂走,當(dāng)yi=0的時候, 只剩下后一項了谋作。
對數(shù)似然函數(shù)?
然后我們可以定義我們的損失函數(shù)了芋肠,最大化對數(shù)似然函數(shù),即最小化負(fù)的對數(shù)似然函數(shù)瓷们,
即
上式其實是交叉熵业栅,這個概念之后會細(xì)講秒咐。這邊主要理解損失函數(shù)的由來就可以了谬晕。第三步就是通過算法求解最優(yōu)化問題了,即最小化損失函數(shù)携取,現(xiàn)在我們引出前一節(jié)沒講的梯度下降了攒钳。具體的梯度下降原理后續(xù)會新寫一篇來介紹各種優(yōu)化方法, 簡單理解雷滋,梯度是上升最快的方向不撑,沿著負(fù)梯度方向前進可以使目標(biāo)函數(shù)變小文兢,但是步伐如果過大,忽略的二階導(dǎo)項可能就不能忽略了焕檬。所以要定義一個學(xué)習(xí)率姆坚,避免步子太大。
我們首先講一下sigmoid函數(shù)的導(dǎo)數(shù)实愚,?
可以看出sigmoid的導(dǎo)數(shù)還是很漂亮的兼呵。
回到最小化損失函數(shù)上,我們對損失函數(shù)求梯度, 以參數(shù)為例
參數(shù)的每一個維度都是一樣的求法腊敲,然后我們定義一個學(xué)習(xí)率击喂,沿著負(fù)梯度方向,就可以一步步收斂碰辅,求得模型的參數(shù)了懂昂。
LR模型暫時先講到這里,以后想到什么新的會繼續(xù)往上面添加没宾。
轉(zhuǎn)發(fā)請注明凌彬,謝謝。