NLP文本分類--RNN(LSTM) ATTENTION

開篇

文章參考:http://www.reibang.com/p/8b78ac379e3a

文本分類是NLP中的一個(gè)重要方向凹蜂,它是智能問答锌历、情感分析的基礎(chǔ)。在未來自然語言處理的接觸嗜桌、學(xué)習(xí)中將持續(xù)在該方向上寫一些文章總結(jié)赴涵。

在前述的ATT-CNN中摔吏,參考了一篇文章是RNN-ATTENTION鸽嫂。在很早之前就對(duì)RNN有過一些了解但是知之甚少,概念也很不清楚征讲,本篇決定在實(shí)現(xiàn)RNN_ATTENTION的同時(shí)据某,再了解并理解下RNN。

RNN

http://www.reibang.com/p/8b78ac379e3a(RNN簡(jiǎn)介)

http://blog.sina.com.cn/s/blog_4eddfe990102x1li.html(實(shí)現(xiàn)一個(gè)RNN-cell)

https://blog.csdn.net/pnnngchg/article/details/84451037(輸入的維度與hiddensize诗箍?)

只說之前沒有理解到位的癣籽,RNN多用于處理序列數(shù)據(jù),比如一句話等等滤祖。圖像也可以在某一維度上作為序列數(shù)據(jù)筷狼,只不過圖像具有天然的自編碼特性,無需再將任意序列中的數(shù)據(jù)做編碼匠童。下圖是RNN-cell的結(jié)構(gòu)埂材,它的輸入是序列中前一個(gè)隱藏狀態(tài)+該時(shí)刻的向量輸入。如何計(jì)算隱藏狀態(tài)汤求。首先俏险,將輸入和先前隱藏狀態(tài)組合以形成向量严拒。該向量現(xiàn)在具有關(guān)于當(dāng)前輸入和先前輸入的信息。向量經(jīng)過tanh函數(shù)竖独,輸出是新的隱藏狀態(tài)裤唠,或網(wǎng)絡(luò)的內(nèi)存。


LSTM

和RNN一樣的數(shù)據(jù)流程莹痢,區(qū)別就在于細(xì)胞內(nèi)的操作种蘸。LSTM-cell的結(jié)構(gòu):遺忘門、輸入門竞膳、輸出門劈彪,細(xì)胞狀態(tài)。

https://www.cnblogs.com/AntonioSu/p/8798960.html(了解細(xì)節(jié)這篇文章)

遺忘門:

遺忘門決定了應(yīng)丟棄或保留哪些信息顶猜。來自先前隱藏狀態(tài)的信息和來自當(dāng)前輸入的信息通過sigmoid函數(shù)傳遞沧奴。值介于0和1之間,越接近0意味著忘記长窄,越接近1意味著要保持滔吠。

輸入門

輸入門要更新單元狀態(tài),首先挠日,我們將先前的隱藏狀態(tài)和當(dāng)前輸入傳遞給sigmoid函數(shù)疮绷。這決定了通過將值轉(zhuǎn)換為0到1來更新哪些值:0表示不重要,1表示重要嚣潜。接著你還要將隱藏狀態(tài)和當(dāng)前輸入傳遞給tanh函數(shù)冬骚,以便在-1和1之間取值以幫助調(diào)節(jié)網(wǎng)絡(luò)。然后將tanh輸出與sigmoid輸出相乘懂算。sigmoid輸出將決定哪些信息對(duì)于輸出很重要只冻。

細(xì)胞狀態(tài)

現(xiàn)在我們應(yīng)該有足夠的信息來計(jì)算細(xì)胞狀態(tài)。首先计技,細(xì)胞狀態(tài)逐點(diǎn)乘以遺忘向量喜德。如果它乘以接近0的值,則有可能在單元狀態(tài)中丟棄垮媒。然后我們從輸入門獲取輸出并進(jìn)行逐點(diǎn)相加舍悯,將神經(jīng)網(wǎng)絡(luò)發(fā)現(xiàn)的新值更新為細(xì)胞狀態(tài)中,這就給了我們新的細(xì)胞狀態(tài)睡雇。

輸出門

最后是輸出門萌衬,輸出門決定下一個(gè)隱藏狀態(tài)應(yīng)該是什么。請(qǐng)記住它抱,隱藏狀態(tài)包含有關(guān)先前輸入的信息秕豫,隱藏狀態(tài)也可用于預(yù)測(cè)。首先抗愁,我們將先前的隱藏狀態(tài)和當(dāng)前輸入傳遞給sigmoid函數(shù)馁蒂。然后我們將新修改的單元狀態(tài)傳遞給tanh函數(shù)呵晚。我們將tanh輸出與sigmoid輸出相乘,以確定隱藏狀態(tài)應(yīng)攜帶的信息沫屡,輸出的是隱藏狀態(tài)饵隙。然后將新的細(xì)胞狀態(tài)和新的隱藏狀態(tài)轉(zhuǎn)移到下一個(gè)時(shí)間步。


GRU

LSTM的變種沮脖,整體的實(shí)現(xiàn)比LSTM簡(jiǎn)單金矛,計(jì)算會(huì)少一些。


LSTM實(shí)現(xiàn)舉例

多層LSTM實(shí)現(xiàn)mnist分類

https://blog.csdn.net/jerr__y/article/details/61195257

GRU-ATTENTION實(shí)現(xiàn)文本分類

論文

Hierarchical Attention Networks for Document Classification

論文網(wǎng)址

https://www.aclweb.org/anthology/N16-1174/

論文解讀

https://blog.csdn.net/u012052268/article/details/80698930#28-%E5%88%86%E5%B1%82%E6%B3%A8%E6%84%8F%E5%8A%9B

摘要

用于文本分類勺届,分層注意力機(jī)制驶俊,詞級(jí)別和句子級(jí)別的注意力機(jī)制使用。

簡(jiǎn)單使用(詞注意力)

基于RNN-attention實(shí)現(xiàn)影評(píng)的情感分類免姿、文本分類

http://www.reibang.com/p/cc6407444a8c

https://github.com/ilivans/tf-rnn-attention

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末饼酿,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子胚膊,更是在濱河造成了極大的恐慌故俐,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,183評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件紊婉,死亡現(xiàn)場(chǎng)離奇詭異药版,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)喻犁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門槽片,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人肢础,你說我怎么就攤上這事还栓。” “怎么了乔妈?”我有些...
    開封第一講書人閱讀 168,766評(píng)論 0 361
  • 文/不壞的土叔 我叫張陵蝙云,是天一觀的道長(zhǎng)氓皱。 經(jīng)常有香客問我路召,道長(zhǎng),這世上最難降的妖魔是什么波材? 我笑而不...
    開封第一講書人閱讀 59,854評(píng)論 1 299
  • 正文 為了忘掉前任股淡,我火速辦了婚禮,結(jié)果婚禮上廷区,老公的妹妹穿的比我還像新娘唯灵。我一直安慰自己,他們只是感情好隙轻,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,871評(píng)論 6 398
  • 文/花漫 我一把揭開白布埠帕。 她就那樣靜靜地躺著垢揩,像睡著了一般。 火紅的嫁衣襯著肌膚如雪敛瓷。 梳的紋絲不亂的頭發(fā)上叁巨,一...
    開封第一講書人閱讀 52,457評(píng)論 1 311
  • 那天,我揣著相機(jī)與錄音呐籽,去河邊找鬼锋勺。 笑死,一個(gè)胖子當(dāng)著我的面吹牛狡蝶,可吹牛的內(nèi)容都是我干的庶橱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,999評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼贪惹,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼苏章!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起奏瞬,我...
    開封第一講書人閱讀 39,914評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤布近,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后丝格,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體撑瞧,經(jīng)...
    沈念sama閱讀 46,465評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,543評(píng)論 3 342
  • 正文 我和宋清朗相戀三年显蝌,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了预伺。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,675評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡曼尊,死狀恐怖酬诀,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情骆撇,我是刑警寧澤瞒御,帶...
    沈念sama閱讀 36,354評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站神郊,受9級(jí)特大地震影響肴裙,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜涌乳,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,029評(píng)論 3 335
  • 文/蒙蒙 一蜻懦、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧夕晓,春花似錦宛乃、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽析既。三九已至,卻和暖如春谆奥,著一層夾襖步出監(jiān)牢的瞬間渡贾,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評(píng)論 1 274
  • 我被黑心中介騙來泰國打工雄右, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留空骚,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,091評(píng)論 3 378
  • 正文 我出身青樓擂仍,卻偏偏與公主長(zhǎng)得像囤屹,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子逢渔,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,685評(píng)論 2 360

推薦閱讀更多精彩內(nèi)容