文本生成

文本生成就是一個source text 到 target text的映射過程泡躯。

文本生成與文本分類的方法類似,只是在拿到輸入文本的語義表示后的處理方式不同,還需要將這個語義表示輸入到decoder中解碼生成目標(biāo)文本柳弄。

1疯潭、將給定的訓(xùn)練數(shù)據(jù)中的源文本和目標(biāo)文本進(jìn)行分詞,分別建立詞典祝旷。

2履澳、使用Word2Vec訓(xùn)練詞向量。

3怀跛、輸入源文本的詞向量到神經(jīng)網(wǎng)絡(luò)中

4距贷、輸出源文本的語義表示,然后將該語義表示作為decoder的初始隱狀態(tài)輸入到decoder中吻谋,同時接受y_{0} =<SOS>的向量忠蝗,即start of sequence,進(jìn)行解碼漓拾。

5阁最、在解碼的時間步t,通過softmax輸出y_{t} 骇两。這時有三種處理方式速种,第一種直接將y_{t} 作為下一個時間步的輸入,但是這種方法會導(dǎo)致錯誤累積低千。如果這一個時間步輸出錯誤配阵,那么將其作為后續(xù)的輸入,將會導(dǎo)致以后的時間步的輸出都是錯誤的示血。因此有了第二種方法棋傍,就是每一步的輸入都使用上一步標(biāo)準(zhǔn)的正確的輸出結(jié)果,即訓(xùn)練集中的數(shù)據(jù)难审。這樣子就確保每一個時間步的輸入都是絕對正確的瘫拣。但是這種方法訓(xùn)練出的模型會產(chǎn)生過擬合的問題,如果遇到不在訓(xùn)練集中的數(shù)據(jù)告喊,模型效果極差麸拄。因此,綜合前面兩種方法葱绒,提出了第三種方法感帅,使用teacher forcing。即每一步輸入時地淀,使用采樣sample的方法失球,若采樣的數(shù)據(jù)>0.5,那么就采用訓(xùn)練集中的期望數(shù)據(jù)作為輸入數(shù)據(jù);若采樣結(jié)果<0.5实苞,那么就采用上一步的實(shí)際輸出結(jié)果作為輸入豺撑。

6、直到decoder輸出<EOS>黔牵,即end of sequence聪轿,或者達(dá)到了最長的字?jǐn)?shù)限制,一次訓(xùn)練結(jié)束猾浦,然后將預(yù)測結(jié)果與期望結(jié)果比較陆错,計算LOSS,設(shè)置優(yōu)化策略金赦,更新權(quán)重參數(shù)音瓷。設(shè)置epoch值,當(dāng)訓(xùn)練次數(shù)到達(dá)epoch時夹抗,模型訓(xùn)練結(jié)束绳慎。

7、進(jìn)行測試漠烧。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末杏愤,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子已脓,更是在濱河造成了極大的恐慌珊楼,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,561評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件摆舟,死亡現(xiàn)場離奇詭異亥曹,居然都是意外死亡邓了,警方通過查閱死者的電腦和手機(jī)恨诱,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,218評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來骗炉,“玉大人照宝,你說我怎么就攤上這事【淇” “怎么了厕鹃?”我有些...
    開封第一講書人閱讀 157,162評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長乍丈。 經(jīng)常有香客問我剂碴,道長,這世上最難降的妖魔是什么轻专? 我笑而不...
    開封第一講書人閱讀 56,470評論 1 283
  • 正文 為了忘掉前任忆矛,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘催训。我一直安慰自己洽议,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,550評論 6 385
  • 文/花漫 我一把揭開白布漫拭。 她就那樣靜靜地躺著亚兄,像睡著了一般。 火紅的嫁衣襯著肌膚如雪采驻。 梳的紋絲不亂的頭發(fā)上审胚,一...
    開封第一講書人閱讀 49,806評論 1 290
  • 那天,我揣著相機(jī)與錄音礼旅,去河邊找鬼菲盾。 笑死,一個胖子當(dāng)著我的面吹牛各淀,可吹牛的內(nèi)容都是我干的懒鉴。 我是一名探鬼主播,決...
    沈念sama閱讀 38,951評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼碎浇,長吁一口氣:“原來是場噩夢啊……” “哼临谱!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起奴璃,我...
    開封第一講書人閱讀 37,712評論 0 266
  • 序言:老撾萬榮一對情侶失蹤悉默,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后苟穆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,166評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡雳旅,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,510評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了抵拘。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,643評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡型豁,死狀恐怖僵蛛,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情迎变,我是刑警寧澤,帶...
    沈念sama閱讀 34,306評論 4 330
  • 正文 年R本政府宣布衣形,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏泪电。R本人自食惡果不足惜般妙,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,930評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望相速。 院中可真熱鬧碟渺,春花似錦、人聲如沸苫拍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,745評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蔬捷。三九已至,卻和暖如春周拐,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背妥粟。 一陣腳步聲響...
    開封第一講書人閱讀 31,983評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留勾给,地道東北人。 一個月前我還...
    沈念sama閱讀 46,351評論 2 360
  • 正文 我出身青樓脓钾,卻偏偏與公主長得像,于是被迫代替她去往敵國和親惭笑。 傳聞我的和親對象是個殘疾皇子侣姆,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,509評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 前面的文章主要從理論的角度介紹了自然語言人機(jī)對話系統(tǒng)所可能涉及到的多個領(lǐng)域的經(jīng)典模型和基礎(chǔ)知識捺宗。這篇文章柱蟀,甚至之后...
    我偏笑_NSNirvana閱讀 13,881評論 2 64
  • 9. 循環(huán)神經(jīng)網(wǎng)絡(luò) 場景描述 循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network)是一種主流的深度學(xué)習(xí)...
    _龍雀閱讀 2,902評論 0 3
  • 訓(xùn)營第2次作業(yè): 1长已,從銀行的商業(yè)盈利模式中你思考學(xué)到了什么? ----銀行是用別人的錢賺取自己的利潤术瓮。但是一直學(xué)...
    Michelle黃果嫦閱讀 139評論 2 1
  • 昨晚做了一個夢,這幾天晚上做的夢胞四,早上都清晰記得恬汁,昨晚被尿憋的難受辜伟,也沒醒,做了夢就是找?guī)蟾攀窃趯W(xué)校导狡,好像快上...
    春雨_373c閱讀 69評論 0 0
  • 內(nèi)置函數(shù) 一、數(shù)字常用方法 to.Fixed(n) 保留小數(shù)n位前提是數(shù)字才能使用 二旱捧、數(shù)組常用方法 ***、re...
    輪徊傷閱讀 269評論 0 0