hierarchical attention network——閱讀筆記

之前的方法是利用稀疏的詞匯特征作文本表示徽龟、CNN蔬啡、rnnLSTM

使用層級的attention network可以捕捉文檔的層級結(jié)構(gòu):1.因?yàn)槲臋n有層級結(jié)構(gòu),所以我們構(gòu)建的句子表示,然后聚合成文本表示 2.文本中不同的句子和單詞有不同的作用沧侥,并且高度依賴上下文善玫,例如水援,相同的詞在不同的文檔中有不用的意思

所以這篇文章,包括兩個level的attention茅郎,一個是在word上的一個是在sentence上的蜗元,為了在構(gòu)建文本表示的時候讓模型對word和sentence有更多的attention。

與之前工作不同的是:本文利用上下文來發(fā)現(xiàn)token什么時候是相關(guān)的系冗,而不是簡單地過濾了token奕扣,

結(jié)構(gòu)圖


HAN:包括幾個部分:word-sequence encoder、word-level attention layer掌敬、sentence encoder惯豆、sentence-level attention layer

1.sequence encoder(GRU-based)

GRU使用門機(jī)制,去追蹤序列的狀態(tài)奔害,沒有使用單獨(dú)的記憶單元

一共有兩種類型的門 :reset gate rt 和update gate zt楷兽,來一起控制信息是怎樣來更新的,time t how to compute the new state:

是之前的狀態(tài)ht-1和目前的狀態(tài)ht的線性插值华临,zt門決定之前有多少信息應(yīng)該被保存芯杀,多少新的信息應(yīng)該被添加,zt的更新方法


xt是時刻t中的序列向量雅潭,候選序列ht^ 使用類似傳統(tǒng)的RNN的方式來計(jì)算

rt是重置門揭厚,控制過去的狀態(tài)對候選狀態(tài)的貢獻(xiàn),如果rt是0寻馏,棋弥。忘記之前的狀態(tài),重置門的更新方法:


2.層級attention

使用層級結(jié)構(gòu)來構(gòu)建document level 向量

2.1 word encoder?

首先embeds the words 通過一個embedding矩陣诚欠,使用雙向的GRU顽染,通過累加詞的雙向信息漾岳,來獲得詞的annotation(注釋?)

We obtain an annotation for a given word wit by concatenating ie.hit = [-!h it; - h it],

(先直接使用了embedding粉寞,后面完整的模型中尼荆,使用的了BiGRU)

2.2 Word Attention

使用attention機(jī)制來提取,對sentence的meaning比較重要的詞唧垦,然后匯集這些詞的表示組成句子向量


1.首先 將word annotation 通過一層的MLP feed得到ut捅儒,作為隱層的表示,

2.然后在word-level振亮,度量詞的重要性作為uit的相似度巧还,然后通過softmax獲得一個標(biāo)準(zhǔn)的重要性權(quán)重ait

3.計(jì)算句子向量,si坊秸,權(quán)重單詞加和

4.context vector uw是最高層級的representation

2.3 sentence encoder


2.4 sentence attention


v是document vector

2.5 document classification


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末麸祷,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子褒搔,更是在濱河造成了極大的恐慌阶牍,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,542評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件星瘾,死亡現(xiàn)場離奇詭異走孽,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)琳状,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評論 3 394
  • 文/潘曉璐 我一進(jìn)店門磕瓷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人念逞,你說我怎么就攤上這事生宛。” “怎么了肮柜?”我有些...
    開封第一講書人閱讀 163,912評論 0 354
  • 文/不壞的土叔 我叫張陵陷舅,是天一觀的道長。 經(jīng)常有香客問我审洞,道長莱睁,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,449評論 1 293
  • 正文 為了忘掉前任芒澜,我火速辦了婚禮仰剿,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘痴晦。我一直安慰自己南吮,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,500評論 6 392
  • 文/花漫 我一把揭開白布誊酌。 她就那樣靜靜地躺著部凑,像睡著了一般通今。 火紅的嫁衣襯著肌膚如雪秦踪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,370評論 1 302
  • 那天,我揣著相機(jī)與錄音感耙,去河邊找鬼误甚。 笑死清钥,一個胖子當(dāng)著我的面吹牛州叠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播浩聋,決...
    沈念sama閱讀 40,193評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼观蜗,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了衣洁?” 一聲冷哼從身側(cè)響起嫂便,我...
    開封第一講書人閱讀 39,074評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎闸与,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體岸售,經(jīng)...
    沈念sama閱讀 45,505評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡践樱,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,722評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了凸丸。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片拷邢。...
    茶點(diǎn)故事閱讀 39,841評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖屎慢,靈堂內(nèi)的尸體忽然破棺而出瞭稼,到底是詐尸還是另有隱情,我是刑警寧澤腻惠,帶...
    沈念sama閱讀 35,569評論 5 345
  • 正文 年R本政府宣布环肘,位于F島的核電站,受9級特大地震影響集灌,放射性物質(zhì)發(fā)生泄漏悔雹。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,168評論 3 328
  • 文/蒙蒙 一欣喧、第九天 我趴在偏房一處隱蔽的房頂上張望腌零。 院中可真熱鬧,春花似錦唆阿、人聲如沸益涧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽闲询。三九已至久免,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間嘹裂,已是汗流浹背妄壶。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留寄狼,地道東北人丁寄。 一個月前我還...
    沈念sama閱讀 47,962評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像泊愧,于是被迫代替她去往敵國和親伊磺。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,781評論 2 354

推薦閱讀更多精彩內(nèi)容