文獻(xiàn)閱讀筆記:Hierarchical Attention Networks for Document Classification

最近在研究Attention機(jī)制在自然語言處理中的應(yīng)用校辩,查找了一些文獻(xiàn)召川。
文獻(xiàn):Hierarchical Attention Networks for Document Classification
GitHub實(shí)現(xiàn)代碼
GitHub實(shí)現(xiàn)代碼
參考博客:Text Classification, Part 3 - Hierarchical attention network


開始正題:

文章主要的兩個(gè)貢獻(xiàn):
  • 第一: 利用文檔原有的層次結(jié)構(gòu)特性(句子是由單詞組成,文檔是由句子組成)汉形,先使用單詞的詞向量表示句子概疆,再此基礎(chǔ)上以句子向量構(gòu)建文檔的信息表示峰搪。
  • 第二:在文檔中概耻,句子對(duì)文檔的重要性貢獻(xiàn)有差異,在句子中單詞對(duì)句子的重要性貢獻(xiàn)也有差異侦高。而單詞和句子的重要性依賴于上下文環(huán)境厌杜。相同的單詞夯尽,在不同的上下文中所表現(xiàn)出的重要性是不一樣的。為了描述這種情況咆槽,引入了Attention機(jī)制來描述這種重要性罗晕。
  • 文章分別從句子級(jí)和文檔級(jí)兩個(gè)層次使用Attention機(jī)制。
  • Attention機(jī)制可以帶來兩個(gè)優(yōu)點(diǎn):一個(gè)可以提升分類性能法褥,第二個(gè)可以提升識(shí)別出在影響最終分類決策的單詞或句子的重要性酬屉。

主要思路
  • 網(wǎng)絡(luò)結(jié)構(gòu):包括五層網(wǎng)絡(luò)呐萨,詞向量編碼(GRU),詞向量Attention層切距,句子向量編碼(GRU)谜悟,句子向量Attention層北秽,softmax輸出層.
    網(wǎng)絡(luò)結(jié)構(gòu)
    image.png

    Attention機(jī)制應(yīng)用的假設(shè)是對(duì)句子的含義贺氓,觀點(diǎn)辙培,情感等任務(wù),每個(gè)單詞的貢獻(xiàn)是不相同的肤粱。因此,使用Attention機(jī)制去抽取更重要的單詞
單詞詞向量:

查詢?cè)~向量表(比如GloVe厨相,Word2Vec等)生成句子中每個(gè)單詞的詞向量,并將句子表示為單詞詞向量的連接
句子鸥鹉。

這里面:

單詞的詞向量

表示的就是句子中每個(gè)單詞的詞向量表示蛮穿,句子的總長度為T。

GRU前向隱狀態(tài)
每個(gè)單詞詞向量的隱狀態(tài)就表示為前向和后向單詞隱狀態(tài)的連接

這種表示方法就表示了以某個(gè)單詞為中心的句子相關(guān)信息毁渗。

單詞級(jí)Attention

因?yàn)榫渥又忻總€(gè)單詞的重要性不相同践磅,因此使用Attention機(jī)制描述每個(gè)單詞的重要性,抽取相對(duì)句子含義重要的那些單詞灸异,使用這些重要的詞的詞向量組成句子的向量表示


image.png

將GRU輸出的詞的引隱狀態(tài)向量羔飞,作為MLP(Multi Layer Percetron)的輸入,計(jì)算得到詞向量隱狀態(tài)的新的表示檐春。

單詞詞向量的attention計(jì)算

這里有個(gè)問題:uw是如何來的逻淌?bw是如何計(jì)算的?uw初始時(shí)隨機(jī)初始化為疟暖,在訓(xùn)練階段學(xué)習(xí)獲得卡儒。bw也是學(xué)習(xí)獲得。

按照和單詞級(jí)的向量表示一樣的方式俐巴,計(jì)算句子級(jí)的向量表示骨望。


基于Attention的句子級(jí)的向量表示生成

將最后句子級(jí)向量表示的文檔輸入softmax層,計(jì)算分類欣舵。
使用的loss是交叉熵

分類和loss計(jì)算

最終結(jié)果:

分類測(cè)試結(jié)果
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末擎鸠,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子缘圈,更是在濱河造成了極大的恐慌劣光,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,639評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件准验,死亡現(xiàn)場(chǎng)離奇詭異赎线,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)糊饱,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,277評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門垂寥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人另锋,你說我怎么就攤上這事滞项。” “怎么了夭坪?”我有些...
    開封第一講書人閱讀 157,221評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵文判,是天一觀的道長。 經(jīng)常有香客問我室梅,道長戏仓,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,474評(píng)論 1 283
  • 正文 為了忘掉前任亡鼠,我火速辦了婚禮赏殃,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘间涵。我一直安慰自己仁热,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,570評(píng)論 6 386
  • 文/花漫 我一把揭開白布勾哩。 她就那樣靜靜地躺著抗蠢,像睡著了一般举哟。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上迅矛,一...
    開封第一講書人閱讀 49,816評(píng)論 1 290
  • 那天妨猩,我揣著相機(jī)與錄音,去河邊找鬼诬乞。 笑死册赛,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的震嫉。 我是一名探鬼主播森瘪,決...
    沈念sama閱讀 38,957評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼票堵!你這毒婦竟也來了扼睬?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,718評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤悴势,失蹤者是張志新(化名)和其女友劉穎窗宇,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體特纤,經(jīng)...
    沈念sama閱讀 44,176評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡军俊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,511評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了捧存。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片粪躬。...
    茶點(diǎn)故事閱讀 38,646評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖昔穴,靈堂內(nèi)的尸體忽然破棺而出镰官,到底是詐尸還是另有隱情,我是刑警寧澤吗货,帶...
    沈念sama閱讀 34,322評(píng)論 4 330
  • 正文 年R本政府宣布泳唠,位于F島的核電站,受9級(jí)特大地震影響宙搬,放射性物質(zhì)發(fā)生泄漏笨腥。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,934評(píng)論 3 313
  • 文/蒙蒙 一勇垛、第九天 我趴在偏房一處隱蔽的房頂上張望扇雕。 院中可真熱鬧,春花似錦窥摄、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,755評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽哨苛。三九已至,卻和暖如春币砂,著一層夾襖步出監(jiān)牢的瞬間建峭,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,987評(píng)論 1 266
  • 我被黑心中介騙來泰國打工决摧, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留亿蒸,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,358評(píng)論 2 360
  • 正文 我出身青樓掌桩,卻偏偏與公主長得像边锁,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子波岛,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,514評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容