轉(zhuǎn)載LSTM原理及實(shí)現(xiàn)

本文轉(zhuǎn)載自:作者:gzj_1101
來(lái)源:CSDN
原文:https://blog.csdn.net/gzj_1101/article/details/79376798

內(nèi)容目錄

前面我們介紹了RNN兼贡,現(xiàn)在我們來(lái)介紹一種特殊的RNN結(jié)構(gòu),LSTM網(wǎng)絡(luò)桶良。我們將逐步介紹LSTM的結(jié)構(gòu),原理,以及利用LSTM識(shí)別手寫數(shù)字的demo跟深刻的理解LSTM。

LSTM網(wǎng)絡(luò)

long short term memory沉颂,即我們所稱呼的LSTM,是為了解決長(zhǎng)期以來(lái)問(wèn)題而專門設(shè)計(jì)出來(lái)的悦污,所有的RNN都具有一種重復(fù)神經(jīng)網(wǎng)絡(luò)模塊的鏈?zhǔn)叫问街搿T跇?biāo)準(zhǔn)RNN中,這個(gè)重復(fù)的結(jié)構(gòu)模塊只有一個(gè)非常簡(jiǎn)單的結(jié)構(gòu)切端,例如一個(gè)tanh層彻坛。


LSTM,一個(gè)tanh層

LSTM 同樣是這樣的結(jié)構(gòu),但是重復(fù)的模塊擁有一個(gè)不同的結(jié)構(gòu)踏枣。不同于單一神經(jīng)網(wǎng)絡(luò)層昌屉,這里是有四個(gè),以一種非常特殊的方式進(jìn)行交互茵瀑。


LSTM

不必?fù)?dān)心這里的細(xì)節(jié)间驮。我們會(huì)一步一步地剖析 LSTM 解析圖。現(xiàn)在马昨,我們先來(lái)熟悉一下圖中使用的各種元素的圖標(biāo)竞帽。
元素圖標(biāo)

在上面的圖例中,每一條黑線傳輸著一整個(gè)向量鸿捧,從一個(gè)節(jié)點(diǎn)的輸出到其他節(jié)點(diǎn)的輸入屹篓。粉色的圈代表 pointwise 的操作,諸如向量的和笛谦,而黃色的矩陣就是學(xué)習(xí)到的神經(jīng)網(wǎng)絡(luò)層抱虐。合在一起的線表示向量的連接,分開(kāi)的線表示內(nèi)容被復(fù)制饥脑,然后分發(fā)到不同的位置恳邀。

LSTM核心思想

LSTM的關(guān)鍵在于細(xì)胞的狀態(tài)整個(gè)(如下圖)懦冰,和穿過(guò)細(xì)胞的那條水平線。

細(xì)胞狀態(tài)類似于傳送帶谣沸。直接在整個(gè)鏈上運(yùn)行刷钢,只有一些少量的線性交互。信息在上面流傳保持不變會(huì)很容易乳附。

綠色表示一個(gè)cell

可以實(shí)現(xiàn)選擇性地讓信息通過(guò)内地,主要是通過(guò)一個(gè) sigmoid 的神經(jīng)層 和一個(gè)逐點(diǎn)相乘的操作來(lái)實(shí)現(xiàn)的。
控制門

sigmoid 層輸出(是一個(gè)向量)的每個(gè)元素都是一個(gè)在 0 和 1 之間的實(shí)數(shù)赋除,表示讓對(duì)應(yīng)信息通過(guò)的權(quán)重(或者占比)阱缓。比如, 0 表示“不讓任何信息通過(guò)”举农, 1 表示“讓所有信息通過(guò)”荆针。

LSTM通過(guò)三個(gè)這樣的本結(jié)構(gòu)來(lái)實(shí)現(xiàn)信息的保護(hù)和控制。這三個(gè)門分別輸入門颁糟、遺忘門和輸出門航背。

逐步理解LSTM

現(xiàn)在我們就開(kāi)始通過(guò)三個(gè)門逐步的了解LSTM的原理

遺忘門

在我們 LSTM 中的第一步是決定我們會(huì)從細(xì)胞狀態(tài)中丟棄什么信息。這個(gè)決定通過(guò)一個(gè)稱為忘記門層完成棱貌。該門會(huì)讀取h_{t?1}x_t玖媚,輸出一個(gè)在 0到 1之間的數(shù)值給每個(gè)在細(xì)胞狀態(tài)C_{t?1}中的數(shù)字。1 表示“完全保留”婚脱,0 表示“完全舍棄”今魔。

讓我們回到語(yǔ)言模型的例子中來(lái)基于已經(jīng)看到的預(yù)測(cè)下一個(gè)詞。在這個(gè)問(wèn)題中起惕,細(xì)胞狀態(tài)可能包含當(dāng)前主語(yǔ)的性別涡贱,因此正確的代詞可以被選擇出來(lái)。當(dāng)我們看到新的主語(yǔ)惹想,我們希望忘記舊的主語(yǔ)问词。

Forget Gate,遺忘門

其中
h_{t?1}
表示的是 上一時(shí)刻隱含層的 輸出,
x_t
表示的是當(dāng)前細(xì)胞的輸入嘀粱。σ表示sigmod函數(shù)激挪。

輸入門

下一步是決定讓多少新的信息加入到 cell 狀態(tài) 中來(lái)。實(shí)現(xiàn)這個(gè)需要包括兩個(gè)步驟:首先锋叨,一個(gè)叫做“input gate layer ”的 sigmoid 層決定哪些信息需要更新垄分;一個(gè) tanh 層生成一個(gè)向量,也就是備選的用來(lái)更新的內(nèi)容娃磺,\tilde{C}_t
薄湿。在下一步,我們把這兩部分聯(lián)合起來(lái),對(duì) cell 的狀態(tài)進(jìn)行一個(gè)更新豺瘤。

Input Gate,輸入門

現(xiàn)在是更新舊細(xì)胞狀態(tài)的時(shí)間了吆倦,
C_{t?1}
更新為
C_t
。前面的步驟已經(jīng)決定了將會(huì)做什么坐求,我們現(xiàn)在就是實(shí)際去完成蚕泽。

我們把舊狀態(tài)與f_t相乘,丟棄掉我們確定需要丟棄的信息桥嗤。接著加上i_t\ast{\tilde{C_t}}
须妻。這就是新的候選值,根據(jù)我們決定更新每個(gè)狀態(tài)的程度進(jìn)行變化泛领。

在語(yǔ)言模型的例子中荒吏,這就是我們實(shí)際根據(jù)前面確定的目標(biāo),丟棄舊代詞的性別信息并添加新的信息的地方师逸。


細(xì)胞狀態(tài)更新

輸出門

最終司倚,我們需要確定輸出什么值。這個(gè)輸出將會(huì)基于我們的細(xì)胞狀態(tài)篓像,但是也是一個(gè)過(guò)濾后的版本。首先皿伺,我們運(yùn)行一個(gè) sigmoid 層來(lái)確定細(xì)胞狀態(tài)的哪個(gè)部分將輸出出去员辩。接著,我們把細(xì)胞狀態(tài)通過(guò) tanh 進(jìn)行處理(得到一個(gè)在 -1 到 1 之間的值)并將它和 sigmoid 門的輸出相乘鸵鸥,最終我們僅僅會(huì)輸出我們確定輸出的那部分奠滑。

在語(yǔ)言模型的例子中,因?yàn)樗涂吹搅艘粋€(gè)代詞妒穴,可能需要輸出與一個(gè)動(dòng)詞相關(guān)的信息宋税。例如,可能輸出是否代詞是單數(shù)還是負(fù)數(shù)讼油,這樣如果是動(dòng)詞的話杰赛,我們也知道動(dòng)詞需要進(jìn)行的詞形變化。


輸出門

LSTM實(shí)現(xiàn)手寫數(shù)字

這里我們利用的數(shù)據(jù)集是tensorflow提供的一個(gè)手寫數(shù)字?jǐn)?shù)據(jù)集矮台。該數(shù)據(jù)集是一個(gè)包含n張28*28的數(shù)據(jù)集乏屯。
源代碼:
https://github.com/geroge-gao/deeplearning/tree/master/LSTM

參考資料

[1].http://www.reibang.com/p/9dc9f41f0b29
[2].http://blog.csdn.net/Jerr__y/article/details/58598296
[3].Stacked Long Short-Term Memory Networks

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市瘦赫,隨后出現(xiàn)的幾起案子辰晕,更是在濱河造成了極大的恐慌,老刑警劉巖确虱,帶你破解...
    沈念sama閱讀 222,183評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件含友,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)窘问,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門扎唾,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人南缓,你說(shuō)我怎么就攤上這事胸遇。” “怎么了汉形?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,766評(píng)論 0 361
  • 文/不壞的土叔 我叫張陵纸镊,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我概疆,道長(zhǎng)逗威,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,854評(píng)論 1 299
  • 正文 為了忘掉前任岔冀,我火速辦了婚禮凯旭,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘使套。我一直安慰自己罐呼,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,871評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布侦高。 她就那樣靜靜地躺著嫉柴,像睡著了一般。 火紅的嫁衣襯著肌膚如雪奉呛。 梳的紋絲不亂的頭發(fā)上计螺,一...
    開(kāi)封第一講書(shū)人閱讀 52,457評(píng)論 1 311
  • 那天,我揣著相機(jī)與錄音瞧壮,去河邊找鬼登馒。 笑死,一個(gè)胖子當(dāng)著我的面吹牛咆槽,可吹牛的內(nèi)容都是我干的陈轿。 我是一名探鬼主播,決...
    沈念sama閱讀 40,999評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼罗晕,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼济欢!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起小渊,我...
    開(kāi)封第一講書(shū)人閱讀 39,914評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤法褥,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后酬屉,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體半等,經(jīng)...
    沈念sama閱讀 46,465評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡揍愁,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,543評(píng)論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了杀饵。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片莽囤。...
    茶點(diǎn)故事閱讀 40,675評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖切距,靈堂內(nèi)的尸體忽然破棺而出朽缎,到底是詐尸還是另有隱情,我是刑警寧澤谜悟,帶...
    沈念sama閱讀 36,354評(píng)論 5 351
  • 正文 年R本政府宣布话肖,位于F島的核電站,受9級(jí)特大地震影響葡幸,放射性物質(zhì)發(fā)生泄漏最筒。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,029評(píng)論 3 335
  • 文/蒙蒙 一蔚叨、第九天 我趴在偏房一處隱蔽的房頂上張望床蜘。 院中可真熱鬧,春花似錦蔑水、人聲如沸邢锯。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,514評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)弹囚。三九已至,卻和暖如春领曼,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蛮穿。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,616評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工庶骄, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人践磅。 一個(gè)月前我還...
    沈念sama閱讀 49,091評(píng)論 3 378
  • 正文 我出身青樓单刁,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親府适。 傳聞我的和親對(duì)象是個(gè)殘疾皇子羔飞,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,685評(píng)論 2 360

推薦閱讀更多精彩內(nèi)容