簡單理解 最小二乘法 和梯度下降

在機器學(xué)習(xí)中 我們要訓(xùn)練得到的模型,其實 是一個【 學(xué)習(xí)擬合 自變量和因變量 關(guān)系】的一個過程,關(guān)于 到底 是怎么擬合 學(xué)習(xí)的呢先鱼,分兩種俭正,一種是通曉了公式秘籍 一步到位的,一種是 以迭代方式 步步為營 不斷逼近的方式型型。不論哪種方式 都可以有效抵達 最優(yōu)點 段审,或許是局部最優(yōu)點。

那我們說 現(xiàn)實意義上 模型終歸只是一個模型而已 他是抽象的一個黑盒子的參數(shù)集合闹蒜,他是 現(xiàn)實世界 在抽象計算機上的一個映射寺枉。哪怕可以解釋 ,他只是 無限 接近 無限 擬合绷落,哪怕 Predict 是 100%姥闪。
只要 模型存在 ,那么就會有誤差存在砌烁,如果Predict是100% 正確筐喳,我們就說 誤差 為0,自然 Predict 很難 100%函喉,對于回歸問題避归,每一條 rawdata 向量化feature 對應(yīng)y target 的都有誤差,那么誤差 的 匯總【不一定是 誤差值求和管呵,也可能是 誤差絕對值 求和梳毙,也可能是誤差平方和 相加】就是 這個模型的損失,一個模型 要從大局上來看損失捐下,這個損失程度就是 這個模型評估優(yōu)劣的一項標(biāo)準(zhǔn)账锹。模型越好 損失越小,模型越差 損失越大坷襟。

那么怎么評價損失呢奸柬,樸素來說我們 期待試用 擬合的殘差來作為 損失 ,但是 擬合來說有正有負婴程,最后匯總起來廓奕,假如一個很爛的模型,有一半殘差都是正值很大排抬,有一半殘差都是負值也很大懂从,但是假如有可能匯總相加在一起就是0了,也可能是負值蹲蒲,我們能說這個模型超級棒嘛番甩,當(dāng)然是有問題的。那我們再來考慮使用 絕對值届搁,絕對值總體上來說 不會出現(xiàn) 負值缘薛,但是 計算起來不夠友好窍育,另外對模型 的真正擬合程度反映不夠直觀,不能 突出異常值存在宴胧。好 就剩 平方和了漱抓,平方和的優(yōu)點在于 能夠體現(xiàn) 放大 模型的 擬合效果,如果 殘差有一個很大恕齐,就會被無限放大乞娄,影響模型的擬合效果,模型就不算是最優(yōu)的显歧,需要繼續(xù)訓(xùn)練找到最佳的仪或。所以來說 平方和的損失函數(shù) 更對異常值 敏感∈恐瑁∑(y^ --y)^2

所以在回歸問題上 我們大對數(shù)的損失函數(shù)都是 平方和 形式的累加和范删。
好了既然我們 確定了 損失函數(shù)了,那我們 最關(guān)鍵的一步就是 模型的參數(shù)估計拷肌。
拿線性回歸函數(shù)來說 y= ?1.X1+?2.X2+?3.X3+....+?n..Xn+b
我們 如何 去 估計 ?1 ?2 ?3 的取值呢到旦。
這個從源函數(shù)是不容易找打答案的,我們來看損失函數(shù)
L(f)=∑(?1.X1+?2.X2+?3.X3+....+?n..Xn+b--y^),
想要求得參數(shù) 就得 求? i 的偏導(dǎo)
?L(f)/??i=?∑(?1.X1+?2.X2+?3.X3+....+?n..Xn+b--y^)/??i

當(dāng)其值為0時求得 ? i的 最優(yōu)解巨缘。
這樣一來 由公式就可以各個擊破 添忘,每個參數(shù)的值了。這個是一部到位

下面來看梯度下降 若锁,
所謂的梯度下降昔汉,我們優(yōu)先考慮三維數(shù)據(jù),在三位數(shù)據(jù)中 我們得到的函數(shù)所映射的面可能不是一個平面拴清,可能是多個光滑的曲面,可能會非常的有沒会通。那么 我們的損失函數(shù)有時候 就是代表這么的一個多個曲面的集合口予。我們想要找到損失函數(shù)的最小值,可能就是這個 曲面集合的【低洼地帶】 有的時候 低洼地帶可能只是一個局部最小值涕侈,所以需要謹慎沪停,那我們是怎么去逼近這個低洼地帶的呢,就是 靠著梯度下降裳涛,我們假設(shè)低洼地帶的梯度為0木张,從任一點開始,只要 梯度是不斷下降的趨勢我們就像做電梯一樣往下走端三,當(dāng)然找到梯度下降最快的方向舷礼,我們 迭代的次數(shù)就越少,就越省力郊闯。

梯度下降法的缺點是到最小點的時候收斂速度變慢妻献,并且對初始點的選擇極為敏感蛛株,其改進大多是在這兩方面下功夫

什么是梯度方向 就是 某一維數(shù)據(jù)的偏導(dǎo) 的導(dǎo)數(shù),等于是求二次導(dǎo)數(shù)育拨,對每個 偏導(dǎo)的導(dǎo)數(shù) 做比較谨履,查看 到底是哪一維 下降是最多的, 這樣一來 梯度下降很難是一條直線熬丧,碰碰撞撞下就達到了低洼地帶笋粟。

導(dǎo)數(shù)與梯度

梯度的定義如下:

 
梯度定義

梯度的提出只為回答一個問題:
 函數(shù)在變量空間的某一點處,沿著哪一個方向有最大的變化率析蝴?
 梯度定義如下:
 函數(shù)在某一點的梯度是這樣一個向量害捕,它的方向與取得最大方向?qū)?shù)的方向一致,而它的模為方向?qū)?shù)的最大值嫌变。
 這里注意三點:
 1)梯度是一個向量吨艇,即有方向有大小腾啥;
 2)梯度的方向是最大方向?qū)?shù)的方向东涡;
 3)梯度的值是最大方向?qū)?shù)的值。

導(dǎo)數(shù)與向量

提問:導(dǎo)數(shù)與偏導(dǎo)數(shù)與方向?qū)?shù)是向量么倘待?
 向量的定義是有方向(direction)有大写堋(magnitude)的量。
 從前面的定義可以這樣看出凸舵,偏導(dǎo)數(shù)和方向?qū)?shù)表達的是函數(shù)在某一點沿某一方向的變化率祖娘,也是具有方向和大小的。因此從這個角度來理解啊奄,我們也可以把偏導(dǎo)數(shù)和方向?qū)?shù)看作是一個向量渐苏,向量的方向就是變化率的方向,向量的模菇夸,就是變化率的大小琼富。
 那么沿著這樣一種思路,就可以如下理解梯度:
 梯度即函數(shù)在某一點最大的方向?qū)?shù)庄新,函數(shù)沿梯度方向函數(shù)有最大的變化率鞠眉。

梯度下降法

既然在變量空間的某一點處,函數(shù)沿梯度方向具有最大的變化率择诈,那么在優(yōu)化目標(biāo)函數(shù)的時候械蹋,自然是沿著負梯度方向去減小函數(shù)值,以此達到我們的優(yōu)化目標(biāo)羞芍。
 如何沿著負梯度方向減小函數(shù)值呢哗戈?既然梯度是偏導(dǎo)數(shù)的集合,如下:
 

梯度定義

同時梯度和偏導(dǎo)數(shù)都是向量涩金,那么參考向量運算法則谱醇,我們在每個變量軸上減小對應(yīng)變量值即可暇仲,梯度下降法可以描述如下:

 
梯度下降法

以上就是梯度下降法的由來,大部分的機器學(xué)習(xí)任務(wù)副渴,都可以利用Gradient Descent來進行優(yōu)化奈附。

其中 α 就是 機器學(xué)習(xí)中的學(xué)習(xí)率 ,超參數(shù) 煮剧,一般來說斥滤,α 剛開始 稍微大點,容易較快逼近勉盅,越到最后 α 越小 佑颇,不然容易震蕩,無法找到最優(yōu)點

參考資料

https://blog.csdn.net/walilk/article/details/50978864
參考書:
《高等數(shù)學(xué)》
《簡明微積分》
參考鏈接:
梯度
https://zh.wikipedia.org/zh-cn/%E5%81%8F%E5%AF%BC%E6%95%B0
方向?qū)?shù)和梯度
http://blog.csdn.net/wolenski/article/details/8030654

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末草娜,一起剝皮案震驚了整個濱河市挑胸,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌宰闰,老刑警劉巖茬贵,帶你破解...
    沈念sama閱讀 211,817評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異移袍,居然都是意外死亡解藻,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,329評論 3 385
  • 文/潘曉璐 我一進店門葡盗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來螟左,“玉大人,你說我怎么就攤上這事觅够〗罕常” “怎么了?”我有些...
    開封第一講書人閱讀 157,354評論 0 348
  • 文/不壞的土叔 我叫張陵喘先,是天一觀的道長奄妨。 經(jīng)常有香客問我,道長苹祟,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,498評論 1 284
  • 正文 為了忘掉前任评雌,我火速辦了婚禮树枫,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘景东。我一直安慰自己砂轻,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,600評論 6 386
  • 文/花漫 我一把揭開白布斤吐。 她就那樣靜靜地躺著搔涝,像睡著了一般厨喂。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上庄呈,一...
    開封第一講書人閱讀 49,829評論 1 290
  • 那天蜕煌,我揣著相機與錄音,去河邊找鬼诬留。 笑死斜纪,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的文兑。 我是一名探鬼主播盒刚,決...
    沈念sama閱讀 38,979評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼绿贞!你這毒婦竟也來了因块?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,722評論 0 266
  • 序言:老撾萬榮一對情侶失蹤籍铁,失蹤者是張志新(化名)和其女友劉穎涡上,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體寨辩,經(jīng)...
    沈念sama閱讀 44,189評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡吓懈,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,519評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了靡狞。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片耻警。...
    茶點故事閱讀 38,654評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖甸怕,靈堂內(nèi)的尸體忽然破棺而出甘穿,到底是詐尸還是另有隱情,我是刑警寧澤梢杭,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布温兼,位于F島的核電站,受9級特大地震影響武契,放射性物質(zhì)發(fā)生泄漏募判。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,940評論 3 313
  • 文/蒙蒙 一咒唆、第九天 我趴在偏房一處隱蔽的房頂上張望届垫。 院中可真熱鬧,春花似錦全释、人聲如沸装处。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,762評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽妄迁。三九已至寝蹈,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間登淘,已是汗流浹背箫老。 一陣腳步聲響...
    開封第一講書人閱讀 31,993評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留形帮,地道東北人槽惫。 一個月前我還...
    沈念sama閱讀 46,382評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像辩撑,于是被迫代替她去往敵國和親界斜。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,543評論 2 349

推薦閱讀更多精彩內(nèi)容