Hierarchical Attention Network for Document Classification原理概述

最近看了”Hierarchical Attention Network for Document Classification”一篇文章盟步，也在網(wǎng)上找了一些資料結(jié)合理解卸勺，發(fā)現(xiàn)在此之前有篇文章跟他提出的模型架構(gòu)基本相似钥庇，只不過不包含attention機(jī)制：“Document Modeling with Gated Recurrent Neural Network for Sentiment Classification”洁仗，也就是說本篇論文是基于這篇論文作了一些改進(jìn)的。所以這里主要結(jié)合兩篇論文進(jìn)行介紹文檔的分層架構(gòu)模型誊抛。

Non-Attention

第一篇文章主要是使用兩個(gè)神經(jīng)網(wǎng)絡(luò)分別建模句子和文檔狈蚤，采用一種自下向上的基于向量的文本表示模型困肩。首先使用CNN/LSTM來建模句子表示，接下來使用雙向GRU模型對(duì)句子表示進(jìn)行編碼得到文檔表示脆侮，這里論文中提到在情感分類任務(wù)中锌畸，GRU往往比RNN效果要好。模型架構(gòu)如下圖所示：

在上圖中靖避，詞向量是從語(yǔ)料庫(kù)中使用Word2vec模型訓(xùn)練出來的潭枣，保存在詞嵌入矩陣中比默。然后使用CNN/LSTM模型學(xué)習(xí)句子表示，這里會(huì)將變長(zhǎng)的句子表示成相同維度的向量卸耘，以消除句子長(zhǎng)度不同所帶來的不便退敦。也就是說之后的GRU模型的輸入是長(zhǎng)度相同的句子向量粘咖。

卷積模型如下圖所示蚣抗，filter的寬度分別取1，2瓮下，3來編碼unigrams翰铡，bigrams和trigrams的語(yǔ)義信息。最后使用一個(gè)Average層捕獲全局信息并轉(zhuǎn)化為固定長(zhǎng)度的輸出向量讽坏。

接下來進(jìn)行文本層面建模锭魔，使用GRU模型，輸入是變長(zhǎng)的句子向量路呜，輸出固定長(zhǎng)度的文本向量迷捧，這里會(huì)對(duì)最后每個(gè)單元的輸出向量進(jìn)行取平均操作，雖然會(huì)忽略句子順序的信息胀葱，但是相對(duì)來說較為簡(jiǎn)單方便漠秋，如下圖所示，其中GNN代表GRU的一個(gè)基礎(chǔ)計(jì)算單元：

With-Attention HAN模型

接下來我們介紹一下本篇文章的模型架構(gòu)抵屿，其實(shí)主要的思想和上面的差不多庆锦，也是分層構(gòu)建只不過加上了兩個(gè)Attention層，用于分別對(duì)句子和文檔中的單詞轧葛、句子的重要性進(jìn)行建模搂抒。其主要思想是，首先考慮文檔的分層結(jié)構(gòu)：?jiǎn)卧~構(gòu)成句子尿扯，句子構(gòu)成文檔求晶，所以建模時(shí)也分這兩部分進(jìn)行。其次衷笋，不同的單詞和句子具有不同的信息量芳杏，不能單純的統(tǒng)一對(duì)待所以引入Attention機(jī)制。而且引入Attention機(jī)制除了提高模型的精確度之外還可以進(jìn)行單詞右莱、句子重要性的分析和可視化蚜锨，讓我們對(duì)文本分類的內(nèi)部有一定了解。模型主要可以分為下面四個(gè)部分慢蜓，如下圖所示：

a word sequence encoder,

a word-level attention layer,

a sentence encoder

a sentence-level attention layer.

亚再、

這里對(duì)Attention機(jī)制進(jìn)行一個(gè)補(bǔ)充介紹，可以參考論文“FEED-FORWARD NETWORKS WITH ATTENTION CAN SOLVE SOME LONG -TERM MEMORY PROBLEMS”里面的插圖：

這里的word sequence encoder也是使用的雙向GRU模型晨抡，與上篇文章不同氛悬。無聊的堆砌一下公式则剃，四個(gè)部分分別對(duì)應(yīng)下面四個(gè)：

Word Encoder：

Word Attention：

Sentence Encoder：

Sentence Attention：

這里不進(jìn)行過多的解釋，主要針對(duì)Attention部分說一下如捅，結(jié)合上圖棍现，我們會(huì)發(fā)現(xiàn)ui是使用一個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)對(duì)hi的隱層表示，然后α是其softmax之后的結(jié)果镜遣，然后使用α對(duì)hi進(jìn)行加權(quán)計(jì)算得到最終的輸出向量即可己肮。總結(jié)如下圖：

最后是一個(gè)文本分類層悲关，其實(shí)就是一個(gè)簡(jiǎn)單的softmax谎僻，然后目標(biāo)函數(shù)使用負(fù)對(duì)數(shù)似然函數(shù)。

原文參考：http://blog.csdn.net/liuchonge/article/details/73610734

最后編輯于：2017.12.11 06:49:15

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末寓辱，一起剝皮案震驚了整個(gè)濱河市艘绍，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌秫筏，老刑警劉巖诱鞠，帶你破解...
沈念sama閱讀 217,734評(píng)論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異这敬，居然都是意外死亡航夺，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,931評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門鹅颊，熙熙樓的掌柜王于貴愁眉苦臉地迎上來敷存，“玉大人，你說我怎么就攤上這事堪伍∶常” “怎么了？”我有些...
開封第一講書人閱讀 164,133評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵帝雇，是天一觀的道長(zhǎng)涮俄。經(jīng)常有香客問我，道長(zhǎng)尸闸，這世上最難降的妖魔是什么彻亲？我笑而不...
開封第一講書人閱讀 58,532評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮吮廉，結(jié)果婚禮上苞尝，老公的妹妹穿的比我還像新娘。我一直安慰自己宦芦，他們只是感情好宙址，可當(dāng)我...
茶點(diǎn)故事閱讀 67,585評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著调卑，像睡著了一般抡砂。火紅的嫁衣襯著肌膚如雪大咱。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,462評(píng)論 1贊 302
城市分裂傳說
那天注益，我揣著相機(jī)與錄音碴巾，去河邊找鬼。笑死丑搔，一個(gè)胖子當(dāng)著我的面吹牛厦瓢，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播低匙，決...
沈念sama閱讀 40,262評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼旷痕，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼碳锈！你這毒婦竟也來了顽冶？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,153評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤售碳，失蹤者是張志新（化名）和其女友劉穎强重，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贸人，經(jīng)...
沈念sama閱讀 45,587評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡间景，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,792評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了艺智。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片倘要。...
茶點(diǎn)故事閱讀 39,919評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖十拣，靈堂內(nèi)的尸體忽然破棺而出封拧，到底是詐尸還是另有隱情，我是刑警寧澤夭问，帶...
沈念sama閱讀 35,635評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布泽西，位于F島的核電站，受9級(jí)特大地震影響缰趋，放射性物質(zhì)發(fā)生泄漏捧杉。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,237評(píng)論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一秘血、第九天我趴在偏房一處隱蔽的房頂上張望味抖。院中可真熱鬧，春花似錦灰粮、人聲如沸仔涩。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,855評(píng)論 0贊 22
一樁弒父案谋竖，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)红柱。三九已至承匣，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間锤悄，已是汗流浹背韧骗。一陣腳步聲響...
開封第一講書人閱讀 32,983評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留零聚，地道東北人袍暴。一個(gè)月前我還...
沈念sama閱讀 48,048評(píng)論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像隶症，于是被迫代替她去往敵國(guó)和親政模。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,864評(píng)論 2贊 354

Hierarchical Attention Network for Document Classification原理概述

推薦閱讀更多精彩內(nèi)容