梯度下降算法
若單個誤差為:
則誤差和:
代入愚战,得
接下來的任務(wù)娇唯,就是要找到合適的齐遵,使得函數(shù)能取到最小值。
這里要用到函數(shù)的梯度塔插。梯度是一個向量梗摇,它指向函數(shù)值上升最快的方向,而梯度的反方向想许,則指向函數(shù)值下降最快的方向伶授。
對于函數(shù)f(x)來說,我們要沿著梯度的反方向流纹,去修改x的值谎砾,直到走到函數(shù)的最小值附近。
對于函數(shù)f(x)捧颅,梯度下降算法的參數(shù)修改規(guī)則為
其中,為函數(shù)f(x)的梯度较雕,為學(xué)習(xí)速率碉哑。
對于函數(shù),對應(yīng)的梯度下降算法的參數(shù)修改規(guī)則為
接下來的問題亮蒋,就是求梯度扣典。
求梯度
函數(shù)的梯度的定義就是它相對于各個變量的偏導(dǎo)數(shù),因此有
得到了
之后慎玖,接下來的任務(wù)就是求
即
因為
所以
代入到贮尖,得
將
代入到
最終得到的修改規(guī)則為