第三次打卡-2020-02-16

學(xué)習(xí)筆記

一频丘、循環(huán)神經(jīng)網(wǎng)絡(luò)

LSTM

長(zhǎng)短期記憶(Long short-term memory, LSTM)是一種特殊的RNN奄毡,主要是為了解決長(zhǎng)序列訓(xùn)練過(guò)程中的梯度消失和梯度爆炸問(wèn)題立叛。簡(jiǎn)單來(lái)說(shuō)患蹂,就是相比普通的RNN夭禽,LSTM能夠在更長(zhǎng)的序列中有更好的表現(xiàn)霞掺。通過(guò)門控狀態(tài)來(lái)控制傳輸狀態(tài),記住需要長(zhǎng)時(shí)間記憶的讹躯,忘記不重要的信息菩彬,對(duì)很多需要“長(zhǎng)期記憶”的任務(wù)來(lái)說(shuō),尤其好用潮梯。

image.png

其中:
遺忘門:控制上一時(shí)間步的記憶細(xì)胞 輸入門:控制當(dāng)前時(shí)間步的輸入
輸出門:控制從記憶細(xì)胞到隱藏狀態(tài)
記憶細(xì)胞:?種特殊的隱藏狀態(tài)的信息的流動(dòng)

GNU

GRU(Gate Recurrent Unit)是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)的一種骗灶。和LSTM(Long-Short Term Memory)一樣,也是為了解決長(zhǎng)期記憶和反向傳播中的梯度等問(wèn)題而提出來(lái)的秉馏。相比LSTM耙旦,使用GRU能夠達(dá)到相當(dāng)?shù)男Ч⑶蚁啾戎赂菀走M(jìn)行訓(xùn)練萝究,能夠很大程度上提高訓(xùn)練效率免都,因此很多時(shí)候會(huì)更傾向于使用GRU。


image.png

其中:
重置門有助于捕捉時(shí)間序列里短期的依賴關(guān)系帆竹;
更新門有助于捕捉時(shí)間序列里長(zhǎng)期的依賴關(guān)系绕娘。

深度循環(huán)神經(jīng)網(wǎng)絡(luò)和雙向循環(huán)神經(jīng)網(wǎng)絡(luò)

1.深度循環(huán)神經(jīng)網(wǎng)絡(luò)不是越深越好,越深對(duì)于數(shù)據(jù)集要求更高栽连;
2.雙向循環(huán)神經(jīng)網(wǎng)絡(luò)中兩者隱藏狀態(tài)H的連接是1維連接险领,也就是concat中參數(shù)dim=1,最后1維的維度變?yōu)閮烧?維維度之和。

二舷暮、梯度消失和梯度爆炸

梯度消失和梯度爆炸

tanh态罪、sigmoid等存在飽和的激活函數(shù)會(huì)出現(xiàn)梯度消失
深度模型有關(guān)數(shù)值穩(wěn)定性的典型問(wèn)題是梯度消失和梯度爆炸。當(dāng)神經(jīng)網(wǎng)絡(luò)的層數(shù)較多時(shí)下面,模型的數(shù)值穩(wěn)定性更容易變差复颈。
    層數(shù)較多時(shí),梯度的計(jì)算也容易出現(xiàn)消失或爆炸沥割。
  隨機(jī)初始化模型參數(shù):
    在神經(jīng)網(wǎng)絡(luò)中耗啦,需要隨機(jī)初始化參數(shù)。因?yàn)榛牛窠?jīng)網(wǎng)絡(luò)模型在層之間各個(gè)單元具有對(duì)稱性帜讲。否則會(huì)出錯(cuò)。
    若將每個(gè)隱藏單元參數(shù)都初始化為相等的值椒拗,則在正向傳播時(shí)每個(gè)隱藏單元將根據(jù)相同的輸入計(jì)算出相同的值似将,并傳遞至輸出層。在反向傳播中蚀苛,每個(gè)隱藏單元的參數(shù)梯度相等在验。因此,這些參數(shù)在使用基于梯度的優(yōu)化算法迭代后值依然相等堵未。之后的迭代亦是如此腋舌。 據(jù)此,無(wú)論隱藏單元有幾個(gè)渗蟹,隱藏層本質(zhì)上只有一個(gè)隱藏單元在發(fā)揮作用块饺。所以,通常將神經(jīng)網(wǎng)絡(luò)的模型參數(shù)雌芽,進(jìn)行隨機(jī)初始化以避免上述問(wèn)題授艰。
例如:PyTorch的默認(rèn)隨機(jī)初始化、Xavier隨機(jī)初始化膘怕。

環(huán)境因素

  • 協(xié)變量偏移:

    輸入分布 P(x)改變想诅,條件分布 P(y∣x)不改變

    如貓和狗中,訓(xùn)練數(shù)據(jù)使用的是貓和狗的真實(shí)的照片岛心,但是在測(cè)試時(shí)来破,我們被要求對(duì)貓和狗的卡通圖片進(jìn)行分類。這就是輸入特征發(fā)生了變化
  • 標(biāo)簽偏移:

    標(biāo)簽P(y)上的邊緣分布的變化忘古,但類條件分布P(x∣y)是不變的

    如訓(xùn)練數(shù)據(jù)集徘禁,數(shù)據(jù)很少只包含流感p(y)的樣本。 而測(cè)試數(shù)據(jù)集有流感p(y)和流感q(y)髓堪,其中不變的是流感癥狀p(x|y)送朱。
  • 概念偏移:

    條件分布 P(y∣x)發(fā)生了變化

    如在建立一個(gè)機(jī)器翻譯系統(tǒng)中娘荡,分布P(y∣x)可能因我們的位置的不同而發(fā)生變化。

三驶沼、過(guò)擬合和欠擬合

一類是模型無(wú)法得到較低的訓(xùn)練誤差炮沐,我們將這一現(xiàn)象稱作欠擬合(underfitting);
另一類是模型的訓(xùn)練誤差遠(yuǎn)小于它在測(cè)試數(shù)據(jù)集上的誤差回怜,我們稱該現(xiàn)象為過(guò)擬合(overfitting)大年。 在實(shí)踐中,我們要盡可能同時(shí)應(yīng)對(duì)欠擬合和過(guò)擬合玉雾。雖然有很多因素可能導(dǎo)致這兩種擬合問(wèn)題翔试,在這里我們重點(diǎn)討論兩個(gè)因素:模型復(fù)雜度和訓(xùn)練數(shù)據(jù)集大小。
解決方法:
1.盡量大一點(diǎn)的訓(xùn)練集复旬;
2.正則化懲罰項(xiàng)(權(quán)重衰減)減少過(guò)擬合:L_2 范數(shù)正則化等
3.丟棄法減少系數(shù)垦缅,但在測(cè)試模型時(shí),我們?yōu)榱四玫礁哟_定性的結(jié)果驹碍,一般不使用丟棄法壁涎。
4.留出法和交叉驗(yàn)證法處理數(shù)據(jù)集(oob)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末幸冻,一起剝皮案震驚了整個(gè)濱河市粹庞,隨后出現(xiàn)的幾起案子咳焚,更是在濱河造成了極大的恐慌洽损,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,561評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件革半,死亡現(xiàn)場(chǎng)離奇詭異碑定,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)又官,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,218評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門延刘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人六敬,你說(shuō)我怎么就攤上這事碘赖。” “怎么了外构?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,162評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵普泡,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我审编,道長(zhǎng)撼班,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,470評(píng)論 1 283
  • 正文 為了忘掉前任垒酬,我火速辦了婚禮砰嘁,結(jié)果婚禮上件炉,老公的妹妹穿的比我還像新娘。我一直安慰自己矮湘,他們只是感情好斟冕,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,550評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著缅阳,像睡著了一般宫静。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上券时,一...
    開(kāi)封第一講書(shū)人閱讀 49,806評(píng)論 1 290
  • 那天孤里,我揣著相機(jī)與錄音,去河邊找鬼橘洞。 笑死捌袜,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的炸枣。 我是一名探鬼主播虏等,決...
    沈念sama閱讀 38,951評(píng)論 3 407
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼适肠!你這毒婦竟也來(lái)了霍衫?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,712評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤侯养,失蹤者是張志新(化名)和其女友劉穎敦跌,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體逛揩,經(jīng)...
    沈念sama閱讀 44,166評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡柠傍,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,510評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了辩稽。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片惧笛。...
    茶點(diǎn)故事閱讀 38,643評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖逞泄,靈堂內(nèi)的尸體忽然破棺而出患整,到底是詐尸還是另有隱情,我是刑警寧澤喷众,帶...
    沈念sama閱讀 34,306評(píng)論 4 330
  • 正文 年R本政府宣布各谚,位于F島的核電站,受9級(jí)特大地震影響侮腹,放射性物質(zhì)發(fā)生泄漏嘲碧。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,930評(píng)論 3 313
  • 文/蒙蒙 一父阻、第九天 我趴在偏房一處隱蔽的房頂上張望愈涩。 院中可真熱鬧望抽,春花似錦、人聲如沸履婉。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,745評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)毁腿。三九已至辑奈,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間已烤,已是汗流浹背鸠窗。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,983評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留胯究,地道東北人稍计。 一個(gè)月前我還...
    沈念sama閱讀 46,351評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像裕循,于是被迫代替她去往敵國(guó)和親臣嚣。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,509評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容