深度學(xué)習(xí)的問題及解決方法

主要面臨的問題包括梯度彌散化,參數(shù)難調(diào)節(jié)缀辩,過擬合等臭埋。這幾個問題最先解決的應(yīng)該是梯度彌散化,即梯度消失和梯度爆炸臀玄,通過適當?shù)膮?shù)初始化瓢阴,可以緩解這個問題;在能收斂的情況下健无,需要對超參數(shù)進行調(diào)節(jié)荣恐,加快收斂速度;收斂后需要對bias和variance進行調(diào)節(jié)累贤,防止過擬合叠穆。

1 梯度彌散化

使用ReLU代替sigmoid.優(yōu)點在于單側(cè)抑制,較寬闊的興奮邊界臼膏,稀疏激活性硼被。更貼合神經(jīng)元的工作原理。ReLU和變種已經(jīng)成為最主流的激活函數(shù)渗磅。Hinton在論文中證明ReLu相當于一堆的sigmoid層嚷硫。

合理參數(shù)初始化可以一定程度緩解特征消失和特征爆炸。對于tanh激活函數(shù)始鱼,參數(shù)矩陣可以用Xavier初始化仔掸,對于ReLu激活函數(shù),吳恩達的建議如下圖所示医清。

模型參數(shù)初始化(來自吳恩達的深度學(xué)習(xí)課程)



2 參數(shù)難以調(diào)試起暮,特別是對SGD

神經(jīng)網(wǎng)絡(luò)通常不是一個凸優(yōu)化問題,充滿了局部最優(yōu)解状勤。有理論表示鞋怀,局部最優(yōu)解也有可能達到比較好的效果双泪,全局最優(yōu)反而是過擬合的持搜。


局部最優(yōu)示意

在高維空間中密似,很難遇到局部最優(yōu)解,直觀地理解葫盼,對每一維都有可能是凹函數(shù)或者凸函數(shù)残腌,20000維的空間,局部最優(yōu)的概率是2的-20000次方贫导。所以抛猫,在高維空間,遇到比較多的是圖中所示的鞍點孩灯。

對于SGD闺金,剛開始的時候我們希望收斂快,而后面則希望穩(wěn)定地落入局部最優(yōu)解峰档。通過Adagrad,Adam等自適應(yīng)的算法可以減輕調(diào)試參數(shù)的負擔败匹。

3 過擬合

使用正則。通過把每層的正則加到最終的損失函數(shù)里讥巡,簡化模型掀亩。直觀理解,就是使得更多的參數(shù)為零欢顷。

使用Dropout進行采樣槽棍,即在深度學(xué)習(xí)某一層輸出的時候隨機丟棄一些數(shù)據(jù)。增大樣本量的同時抬驴,減少特征數(shù)炼七,防止過擬合。

數(shù)據(jù)增強布持。在圖像識別領(lǐng)域特石,可以通過旋轉(zhuǎn),變換鳖链,擴大標注樣本集姆蘸。模型大,數(shù)據(jù)少芙委,可能導(dǎo)致過擬合逞敷,通過增強數(shù)據(jù),可以解決樣本少的問題灌侣。

提早結(jié)束訓(xùn)練(early stopping)推捐。在梯度下降過程中,有時候會遇到侧啼,訓(xùn)練集的代價函數(shù)或者準確率隨迭代輪次單調(diào)遞減牛柒,到了驗證集代價函數(shù)會先下降后上升堪簿,這時候就需要提早結(jié)束。出現(xiàn)這種情況皮壁,往往是因為越往后椭更,參數(shù)w越來越大,出現(xiàn)過擬合蛾魄。使用正則一般不會出現(xiàn)這種情況虑瀑,但使用正則的話,參數(shù)λ的搜索空間比較大滴须,所以有時候為了時間減少舌狗,可以在不使用正則的情況下,在不同的迭代輪次結(jié)束訓(xùn)練扔水,選擇較小的一組w痛侍。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市魔市,隨后出現(xiàn)的幾起案子主届,更是在濱河造成了極大的恐慌,老刑警劉巖嘹狞,帶你破解...
    沈念sama閱讀 221,820評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件岂膳,死亡現(xiàn)場離奇詭異,居然都是意外死亡磅网,警方通過查閱死者的電腦和手機谈截,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來涧偷,“玉大人簸喂,你說我怎么就攤上這事×浅保” “怎么了喻鳄?”我有些...
    開封第一講書人閱讀 168,324評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長确封。 經(jīng)常有香客問我除呵,道長,這世上最難降的妖魔是什么爪喘? 我笑而不...
    開封第一講書人閱讀 59,714評論 1 297
  • 正文 為了忘掉前任颜曾,我火速辦了婚禮,結(jié)果婚禮上秉剑,老公的妹妹穿的比我還像新娘泛豪。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 68,724評論 6 397
  • 文/花漫 我一把揭開白布诡曙。 她就那樣靜靜地躺著臀叙,像睡著了一般。 火紅的嫁衣襯著肌膚如雪价卤。 梳的紋絲不亂的頭發(fā)上劝萤,一...
    開封第一講書人閱讀 52,328評論 1 310
  • 那天冕房,我揣著相機與錄音膛壹,去河邊找鬼。 笑死,一個胖子當著我的面吹牛炸卑,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播煤傍,決...
    沈念sama閱讀 40,897評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼盖文,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蚯姆?” 一聲冷哼從身側(cè)響起五续,我...
    開封第一講書人閱讀 39,804評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎龄恋,沒想到半個月后疙驾,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,345評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡郭毕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,431評論 3 340
  • 正文 我和宋清朗相戀三年它碎,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片显押。...
    茶點故事閱讀 40,561評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡扳肛,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出乘碑,到底是詐尸還是另有隱情挖息,我是刑警寧澤,帶...
    沈念sama閱讀 36,238評論 5 350
  • 正文 年R本政府宣布兽肤,位于F島的核電站套腹,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏资铡。R本人自食惡果不足惜电禀,卻給世界環(huán)境...
    茶點故事閱讀 41,928評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望害驹。 院中可真熱鬧鞭呕,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,417評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至腋么,卻和暖如春咕娄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背珊擂。 一陣腳步聲響...
    開封第一講書人閱讀 33,528評論 1 272
  • 我被黑心中介騙來泰國打工圣勒, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人摧扇。 一個月前我還...
    沈念sama閱讀 48,983評論 3 376
  • 正文 我出身青樓圣贸,卻偏偏與公主長得像,于是被迫代替她去往敵國和親扛稽。 傳聞我的和親對象是個殘疾皇子吁峻,可洞房花燭夜當晚...
    茶點故事閱讀 45,573評論 2 359