機(jī)器翻譯(MT):將一段文本從一種語言自動(dòng)翻譯為另一種語言昌讲,用神經(jīng)網(wǎng)絡(luò)解決這個(gè)問題通常稱為神經(jīng)機(jī)器翻譯(NMT)国夜。 主要特征:輸出是單詞序列而不是單個(gè)單詞。 輸出序列的長度可能與源序列的長度不同剧蚣。
數(shù)據(jù)預(yù)處理:將數(shù)據(jù)集清洗支竹、轉(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)的輸入minbatch
Encoder-Decoder
encoder:輸入到隱藏狀態(tài)
decoder:隱藏狀態(tài)到輸出
Sequence to Sequence模型
模型:
訓(xùn)練:
預(yù)測(cè):
具體結(jié)構(gòu):
學(xué)習(xí)鏈接:機(jī)器翻譯