1翩活、感知機(jī)算法簡述
感知機(jī)算法其實(shí)已經(jīng)很熟悉了,這次看《統(tǒng)計(jì)學(xué)習(xí)方法》權(quán)當(dāng)復(fù)習(xí)一遍踱侣,然后有一個(gè)point對我來說是新的——感知機(jī)算法實(shí)際上采用了隨機(jī)梯度下降埠戳。這其實(shí)是一個(gè)很顯然的點(diǎn),但我之前看到的資料都是直接說明了超平面參數(shù)的更新方式时甚,并從幾何直觀上解釋了這樣做是為了讓超平面向誤分樣本點(diǎn)的方向旋轉(zhuǎn)隘弊,而未從梯度的角度來解釋,這里補(bǔ)充一下這個(gè)角度荒适。
感知機(jī)(perceptron)是二分類線性分類模型梨熙,其輸入空間(特征空間)是,輸出空間是刀诬,由輸入空間到輸出空間的如下函數(shù):
稱為感知機(jī)咽扇。和分別是感知機(jī)的權(quán)值和偏置邪财。
感知機(jī)的損失函數(shù)定義為所有誤分類點(diǎn)到超平面的距離之和,即:
其中表示誤分類點(diǎn)的集合质欲,若固定树埠,則損失函數(shù)梯度為:
采用隨機(jī)梯度下降法,每次隨機(jī)選取一個(gè)誤分類點(diǎn)嘶伟,對進(jìn)行更新:
其中稱為學(xué)習(xí)率怎憋。
感知機(jī)算法流程如下:
(1)選取初值。
(2)在訓(xùn)練集中選取數(shù)據(jù)九昧。
(3)如果,則更新參數(shù):
(4)轉(zhuǎn)至(2)直至訓(xùn)練集中無誤分點(diǎn)绊袋。
2、感知機(jī)算法收斂性證明
所謂感知機(jī)算法的收斂性铸鹰,就是說只要給定而分類問題是線性可分的癌别,那么按上述感知機(jī)算法進(jìn)行操作,在有限次迭代后一定可以找到一個(gè)可將樣本完全分類正確的超平面蹋笼。
首先展姐,為了方便推導(dǎo),我們將偏置并入權(quán)重向量,記作剖毯,同樣將輸入向量加以擴(kuò)充圾笨,記作,顯然速兔,墅拭。
既然樣本是線性可分的,我們可以假設(shè)有一個(gè)滿足條件的超平面將樣本點(diǎn)完全正確分開涣狗,且存在谍婉,對所有,有:
令镀钓,則感知機(jī)算法在訓(xùn)練集上誤分類次數(shù)滿足:
證明:
結(jié)合上述兩個(gè)結(jié)論穗熬,可以得到:
從而感知機(jī)算法的收斂性得證。