2019-01-29 隨機梯度下降中學(xué)習(xí)速率α

確保算法能收斂以及選擇合適的學(xué)習(xí)速率α惦蚊。

對于隨機梯度下降算法幽歼,為了檢查算法是否收斂导饲,沿用之前定義的cost函數(shù)捞高。在算法掃描到樣本(x(i),y(i)) 但在更新參數(shù)θ之前,使用這個樣本算出這個樣本對應(yīng)的cost函數(shù)渣锦。例如:每1000次迭代運算中硝岗,我們對最后1000個樣本的cost值求平均然后畫出來,通過觀察這些畫出來的圖袋毙,我們就能檢查出隨機梯度下降是否在收斂型檀。

收斂

圖1:看起來是有噪聲的,代價值在下降听盖,后面開始變得平緩胀溺。這樣的大致走向基本說明你的學(xué)習(xí)算法已經(jīng)收斂了裂七。如果你使用了更小的學(xué)習(xí)速率,那么很有可能使得算法的學(xué)習(xí)變得更慢了仓坞,代價函數(shù)的下降也變慢了背零。但由于你使用了更小的學(xué)習(xí)速率,你很有可能會讓算法收斂到一個好一點的解无埃。(紅色的曲線代表隨機梯度下降使用一個更小的學(xué)習(xí)速率)徙瓶。隨機梯度下降不是直接收斂到全局最小值,而是在局部最小附近反復(fù)振蕩嫉称,所以使用一個更小的學(xué)習(xí)速率侦镇,最終的振蕩就會更小,有時候這一點小的區(qū)別可以忽略澎埠,但有時候一點小的區(qū)別就會得到更好一點的參數(shù)虽缕。

圖2:看起來已經(jīng)收斂了。如果你把這個數(shù) 1000 提高到5000組樣本蒲稳,那么可能你會得到一條更平滑的曲線。這是增大平均的訓(xùn)練樣本數(shù)的情形伍派。當(dāng)然增大樣本數(shù)的缺點就是現(xiàn)在每5000個樣本才能得到一個數(shù)據(jù)點江耀,因此你所得到的關(guān)于學(xué)習(xí)算法表現(xiàn)的反饋就顯得有一些“延遲”,因為每5000個樣本才能得到圖上的一個數(shù)據(jù)點而不是每1000個樣本就能得到诉植。

圖3:運行梯度下降代價函數(shù)就沒有在減小祥国,算法沒有很好地學(xué)習(xí),需要更大量的樣本進(jìn)行平均晾腔,你很可能會觀察到紅線所示的情況舌稀。使用一個較大的樣本數(shù)量,還是可能會發(fā)現(xiàn)這條學(xué)習(xí)曲線比較平坦灼擂,那可能就更肯定地說明不知道出于什么原因算法確實沒怎么學(xué)習(xí)好壁查,那么你就需要調(diào)整學(xué)習(xí)速率或者改變特征變量或者改變其他的什么

圖4:曲線實際上是在上升,這是一個很明顯的信號表示算法正在發(fā)散剔应。那么你要做的事就是用一個更小一點的學(xué)習(xí)速率α睡腿。

收斂

線看起來噪聲較大或者老是上下振動,那就試試增大你要平均的樣本數(shù)量峻贮,這樣應(yīng)該就能得到比較好的變化趨勢席怪。如果你發(fā)現(xiàn)代價值在上升,那么就換一個小一點的α值纤控。

隨機梯度下降 α

運行隨機梯度下降時挂捻,算法會從某個點開始然后曲折地逼近最小值,但它不會真的收斂船万,而是一直在最小值附近徘徊刻撒,因此你最終得到的參數(shù)實際上只是接近全局最小值惜辑,而不是真正的全局最小值。如果你想讓隨機梯度下降確實收斂到全局最小值疫赎,你可以隨時間的變化減小學(xué)習(xí)速率α的值盛撑。一種典型的方法來設(shè)置α的值是讓α等于某個常數(shù)1 除以 迭代次數(shù)加某個常數(shù)2。?該α的設(shè)置存在的問題是把時間花在確定常數(shù)1和常數(shù)2上捧搞,這讓算法顯得更繁瑣抵卫。但是減小了學(xué)習(xí)速率,振蕩也會越來越小直到落到幾乎靠近全局最小的地方胎撇。這個公式起作用的原因是隨著算法的運行介粘,迭代次數(shù)會越來越大,因此學(xué)習(xí)速率α?xí)冃⊥硎鳎虼四愕拿恳徊骄蜁絹碓叫∫霾桑钡阶罱K收斂到全局最小值。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末爵憎,一起剝皮案震驚了整個濱河市慨亲,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌宝鼓,老刑警劉巖刑棵,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異愚铡,居然都是意外死亡蛉签,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進(jìn)店門沥寥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來碍舍,“玉大人,你說我怎么就攤上這事邑雅∑穑” “怎么了?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵蒂阱,是天一觀的道長锻全。 經(jīng)常有香客問我,道長录煤,這世上最難降的妖魔是什么鳄厌? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮妈踊,結(jié)果婚禮上了嚎,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好歪泳,可當(dāng)我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布萝勤。 她就那樣靜靜地躺著,像睡著了一般呐伞。 火紅的嫁衣襯著肌膚如雪敌卓。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天伶氢,我揣著相機與錄音趟径,去河邊找鬼。 笑死癣防,一個胖子當(dāng)著我的面吹牛蜗巧,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蕾盯,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼幕屹,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了级遭?” 一聲冷哼從身側(cè)響起望拖,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎装畅,沒想到半個月后靠娱,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡掠兄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了锌雀。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蚂夕。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖腋逆,靈堂內(nèi)的尸體忽然破棺而出婿牍,到底是詐尸還是另有隱情,我是刑警寧澤惩歉,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布等脂,位于F島的核電站,受9級特大地震影響撑蚌,放射性物質(zhì)發(fā)生泄漏上遥。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一争涌、第九天 我趴在偏房一處隱蔽的房頂上張望粉楚。 院中可真熱鬧,春花似錦、人聲如沸模软。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽燃异。三九已至携狭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間回俐,已是汗流浹背逛腿。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留鲫剿,地道東北人鳄逾。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像灵莲,于是被迫代替她去往敵國和親雕凹。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內(nèi)容

  • http://www.cnblogs.com/pinard/p/5970503.html 在求解機器學(xué)習(xí)算法的模型...
    吃番茄的土撥鼠閱讀 1,650評論 0 5
  • 背景 學(xué)習(xí)深度學(xué)習(xí)已經(jīng)一段時間了政冻,但是學(xué)習(xí)過程中總覺得缺了點什么枚抵,無從動手編程。因此明场,我還是希望使用寫文章的方式來...
    yjy239閱讀 2,218評論 0 7
  • 在高數(shù)中汽摹,我們求解一個函數(shù)的最小值時,最常用的方法就是求出它的導(dǎo)數(shù)為0的那個點苦锨,進(jìn)而判斷這個點是否能夠取最小值逼泣。但...
    耳朵和爪子閱讀 3,836評論 2 5
  • 什么是梯度下降?在求解機器學(xué)習(xí)算法的模型參數(shù)舟舒,即無約束優(yōu)化問題時拉庶,梯度下降(Gradient Descent)是最...
    燁楓_邱閱讀 2,125評論 0 7
  • 實體店的購物體驗無可替代,但這不意味著實體店就可以墨守成規(guī)秃励,而是應(yīng)更積極地與線上渠道互相支持氏仗,產(chǎn)生更多影響消費者、...
    b5d5edf5911a閱讀 1,160評論 0 0