seq2seq 入門

本文結(jié)構(gòu):

  • 什么是 seq2seq终议?
  • Encoder–Decoder 結(jié)構(gòu)?
  • seq2seq 結(jié)構(gòu)祥山?

什么是 seq2seq圃验?

seq2seq 是一個 Encoder–Decoder 結(jié)構(gòu)的網(wǎng)絡(luò),它的輸入是一個序列缝呕,輸出也是一個序列澳窑, Encoder 中將一個可變長度的信號序列變?yōu)楣潭ㄩL度的向量表達,Decoder 將這個固定長度的向量變成可變長度的目標的信號序列供常。

這個結(jié)構(gòu)最重要的地方在于輸入序列和輸出序列的長度是可變的摊聋,可以用于翻譯,聊天機器人话侧,句法分析栗精,文本摘要等。

下面是寫過的 seq2seq 的應(yīng)用:

RNN與機器翻譯
http://www.reibang.com/p/23b46605857e
如何自動生成文本摘要
http://www.reibang.com/p/abc7e13abc21
自己動手寫個聊天機器人吧
http://www.reibang.com/p/d0f4a751012b


Encoder–Decoder 結(jié)構(gòu)瞻鹏?

Cho 在 2014 年提出了 Encoder–Decoder 結(jié)構(gòu)悲立,即由兩個 RNN 組成,
https://arxiv.org/pdf/1406.1078.pdf

(其中的 RNNCell 可以用 RNN 新博,GRU薪夕,LSTM 等結(jié)構(gòu))

在每個時刻, Encoder 中輸入一個字/詞赫悄,隱藏層就會根據(jù)這個公式而改變原献,

到最后一個字/詞 XT 時 馏慨,隱藏層輸出 c ,因為 RNN 的特點就是把前面每一步的輸入信息都考慮進來了姑隅,所以 c 相當于把整個句子的信息都包含了写隶,可以看成整個句子的一個語義表示。

Decoder 在 t 時刻的隱藏層狀態(tài) ht 由 ht?1讲仰,yt?1慕趴,c 決定:

yt 是由 ht,yt?1鄙陡,c 決定:


f 和 g 都是激活函數(shù)冕房,其中 g 函數(shù)一般是 softmax。

模型最終是要最大化下面這個對數(shù)似然條件概率:

其中每個 (xn, yn) 表示一對輸入輸出的序列趁矾, θ 為模型的參數(shù)耙册。


seq2seq 結(jié)構(gòu)?

Sutskever 在 2014 年也發(fā)表了論文:
https://arxiv.org/pdf/1409.3215.pdf

這個模型結(jié)構(gòu)更簡單毫捣,

因為 Decoder 在 t 時刻 yt 是由 ht详拙,yt?1 決定,而沒有 c:

論文中的 Encoder 和 Decoder 都用的 LSTM 結(jié)構(gòu)蔓同,注意每句話的末尾要有 “<EOS>” 標志溪厘。 Encoder 最后一個時刻的狀態(tài) [cXT,hXT] 就和第一篇論文中說的中間語義向量 c 一樣,它將作為 Decoder 的初始狀態(tài)牌柄,在 Decoder 中,每個時刻的輸出會作為下一個時刻的輸入侧甫,直到 Decoder 在某個時刻預(yù)測輸出特殊符號 <END> 結(jié)束珊佣。

LSTM 的目的是估計條件概率 p(y1, . . . , yT′ |x1, . . . , xT ) ,
它先通過最后一個隱藏層獲得輸入序列 (x1, . . . , xT ) 的固定長度的向量表達 v披粟,
然后用 LSTM-LM 公式計算輸出序列 y1, . . . , yT′ 的概率咒锻,
在這個公式中,初始狀態(tài)就是 v守屉,

而且用了 4 層的 LSTM惑艇,而不是一層:論文中的實驗結(jié)果表明深層的要比單層的效果好
下面是個 3 層的例子

計算公式如下:


為了便于理解,單層的表示如下:


并且對輸入序列做了一個翻轉(zhuǎn)拇泛,即不是把 a, b, c 映射到 α, β, γ, 而是把 c, b, a 映射到 α, β, γ, 這樣的結(jié)果是相應(yīng)的 a 會更接近 α滨巴,并且更利于 SGD 建立輸入輸出間的關(guān)系。


參考:
Learning Phrase Representations using RNN Encoder–Decoder
for Statistical Machine Translation
https://arxiv.org/pdf/1406.1078.pdf

Sequence to Sequence Learning
with Neural Networks
https://arxiv.org/pdf/1409.3215.pdf

Generating Sequences With
Recurrent Neural Networks
https://arxiv.org/pdf/1308.0850.pdf


推薦閱讀 歷史技術(shù)博文鏈接匯總
http://www.reibang.com/p/28f02bb59fe5
也許可以找到你想要的

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末俺叭,一起剝皮案震驚了整個濱河市恭取,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌熄守,老刑警劉巖蜈垮,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件耗跛,死亡現(xiàn)場離奇詭異,居然都是意外死亡攒发,警方通過查閱死者的電腦和手機调塌,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來惠猿,“玉大人羔砾,你說我怎么就攤上這事∥裳铮” “怎么了蜒茄?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長餐屎。 經(jīng)常有香客問我檀葛,道長,這世上最難降的妖魔是什么腹缩? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任屿聋,我火速辦了婚禮,結(jié)果婚禮上藏鹊,老公的妹妹穿的比我還像新娘润讥。我一直安慰自己,他們只是感情好盘寡,可當我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布楚殿。 她就那樣靜靜地躺著,像睡著了一般竿痰。 火紅的嫁衣襯著肌膚如雪脆粥。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天影涉,我揣著相機與錄音变隔,去河邊找鬼。 笑死蟹倾,一個胖子當著我的面吹牛匣缘,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播鲜棠,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼肌厨,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了豁陆?” 一聲冷哼從身側(cè)響起夏哭,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎献联,沒想到半個月后竖配,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體何址,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年进胯,在試婚紗的時候發(fā)現(xiàn)自己被綠了用爪。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡胁镐,死狀恐怖偎血,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情盯漂,我是刑警寧澤颇玷,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站就缆,受9級特大地震影響帖渠,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜竭宰,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一空郊、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧切揭,春花似錦狞甚、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至孕豹,卻和暖如春棺蛛,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背巩步。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留桦踊,地道東北人椅野。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像籍胯,于是被迫代替她去往敵國和親竟闪。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,554評論 2 349

推薦閱讀更多精彩內(nèi)容

  • 近日杖狼,谷歌官方在 Github開放了一份神經(jīng)機器翻譯教程炼蛤,該教程從基本概念實現(xiàn)開始,首先搭建了一個簡單的NMT模型...
    MiracleJQ閱讀 6,353評論 1 11
  • 9. 循環(huán)神經(jīng)網(wǎng)絡(luò) 場景描述 循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network)是一種主流的深度學(xué)習(xí)...
    _龍雀閱讀 2,902評論 0 3
  • 第一章蝶涩、金錢是在靠近你還是遠離你理朋,取決于你的選擇 1.錢是一種能量絮识,它需要流動 金錢是流動的能量 金錢本身沒有意義...
    小白哥說閱讀 527評論 0 0
  • 誰道少年不識愁?梧桐樹下嗽上,念君人消瘦次舌。幽幽思緒何時休,閑情逸志怎堪留兽愤。 悠悠小河映垂柳彼念,景色如常,...
    陶然心情閱讀 488評論 0 1
  • 杜小兔bunny閱讀 209評論 0 1