論文解讀: Few-Shot Text Classification with Induction Network

目的

在文本分類中缀皱,經(jīng)常碰到一些很少出現(xiàn)過的類別或這樣不均衡的類別樣本煤傍,而且當(dāng)前的few-shot技術(shù)經(jīng)常會將輸入的query和support的樣本集合進(jìn)行sample-wise級別的對比。但是疑俭,如果跟同一個類別下的不同表達(dá)的樣本去對比的時候產(chǎn)生的效果就不太好襟齿。
因此,文章的作者就提出了肮雨,通過學(xué)習(xí)sample所屬于的類別的表示得到class-wise的向量,然后跟輸入的query進(jìn)行對比箱玷,這樣能比state-of-the-art的模型提高3%正確率怨规,同時泛化的效率也更高。

模型

模型分為三個模塊:Encoder, Induction 和 Relation. 大概的架構(gòu)如下圖.


1.png

Data:
構(gòu)建數(shù)據(jù)集的時候會把樣本分為support set—S 和 query set — Q锡足,support set就是用來訓(xùn)練參數(shù)的波丰,query set就是用來模擬真實(shí)請求,計算loss的;
support set是從C個Class中舱污,每個class抽出K個樣本生成的呀舔,那么在C個class中剩余的部分就作為query set.
Encoder Module:
Encoder階段就是將support set的文本進(jìn)行encoding; 首先弥虐,會經(jīng)過Bi-LSTM得到這樣句子的表示;
假如:support set的樣本是m (m=C * K)扩灯,LSTM輸出的表示的維度是u的話,經(jīng)過Bi-LSTM會得到H霜瘪,其維度為(m, T, 2u).

2.png

利用Self-Attention得到最終的表示珠插,也希望通過attention的方式來決定哪些hidden state, ht更值得學(xué)習(xí)。于是颖对,作者就通過將Bi-LSTM得到的表示H捻撑,經(jīng)過線性組合和tanh變換,再做Softmax處理得到attention score — a, 其維度是(m,T);
然后將a(m,T) 乘以原來的每個H(m, T, 2u)的ht缤底,并且相加顾患,得到了e矩陣,其維度變成了(m, 2u).


3.png

Induction Module:
在得到每個樣本的表示后,es矩陣(m, 2u)个唧,我們下一步需要將其向上抽象成class的表示了;

4.png

首先江解,通過matrix transformation, Ws(2u,2u),將樣本的表示進(jìn)行變形徙歼,從實(shí)驗(yàn)結(jié)果看犁河,這樣能讓不同類別的樣本區(qū)分得更好鳖枕。同時,由于matrix對于所有樣本向量都是共用的桨螺,不管什么樣的樣本size都可以支持了宾符。所以,將Ws(2u,2u)乘以es矩陣(m, 2u)得到es'(m,2u)
5.png

其次灭翔,為了確保class的表示已經(jīng)囊括了這個sample feature vector魏烫,我們還會動態(tài)地去調(diào)整這個coefficients — d, 這個d是在0,1之間分布,用來確保這個sample的類別所屬缠局。因此则奥,這里會對耦合系數(shù)b進(jìn)行softmax(在大于一定值后,隨著input的增加狭园,softmax的score的值增加得越大); 注意读处,這個耦合系數(shù)b的初始值為0,然后會通過學(xué)習(xí)來更新唱矛。(后面會提到)
6.png

然后罚舱,再通過加權(quán)聚合來得到class的表示ci',其維度是(k, 2u)
7.png

之后,通過squashing函數(shù)將ci'的表示進(jìn)行壓縮绎谦,這種壓縮不會改變正負(fù)但可以減少區(qū)間管闷,得到ci其維度是(k, 2u)
8.png

最后,回到剛才提到的b的更新窃肠,其實(shí)就是動態(tài)規(guī)劃包个,如果這個樣本是屬于這個類別的話,這個sample的向量就應(yīng)該得到更大的值冤留,而且在不同的類別的話碧囊,這個值就應(yīng)該更小纤怒;
9.png

總的來說糯而,通過多次迭代后,不但可以讓不同class之間的表示得到區(qū)分泊窘,同時熄驼,同一個class下的樣本貢獻(xiàn)程度也會通過學(xué)習(xí)后變得不一樣。同時烘豹,這里的Ws(2u,2u)也會給予后面預(yù)測去使用瓜贾。

Relation Module:
在得到了ci(k, 2u)后,我們就可以計算ci與query set的相關(guān)性分?jǐn)?shù)了携悯,作者采用的是neural tensor layer的方式祭芦。
首先,從其中一個class開始蚌卤,假設(shè)是ci(k, 2u)实束,先做一次matrix transformation奥秆, 將Ci轉(zhuǎn)置得到CiT(2u,k),然后乘以M[1:h],其維度(k,n), 得到中間結(jié)果的維度為(2u, n)咸灿,然后乘以query set, eq(n, 2u)得到結(jié)果的維度為(2u, 2u)构订,然后再過一個RELU函數(shù).

10.png

然后,將v(ci,eq)的結(jié)果經(jīng)過全聯(lián)接避矢,再經(jīng)過一個sigmoid函數(shù)悼瘾,得到一個第i個class與query的相似度
11.png

目標(biāo)函數(shù)

最后,把riq的值和yq做對审胸,如果匹配就是1亥宿,否則就是0,計算query set的loss;


12.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末砂沛,一起剝皮案震驚了整個濱河市烫扼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌碍庵,老刑警劉巖映企,帶你破解...
    沈念sama閱讀 221,576評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異静浴,居然都是意外死亡堰氓,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評論 3 399
  • 文/潘曉璐 我一進(jìn)店門苹享,熙熙樓的掌柜王于貴愁眉苦臉地迎上來双絮,“玉大人,你說我怎么就攤上這事得问《谂剩” “怎么了?”我有些...
    開封第一講書人閱讀 168,017評論 0 360
  • 文/不壞的土叔 我叫張陵椭赋,是天一觀的道長抚岗。 經(jīng)常有香客問我或杠,道長哪怔,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,626評論 1 296
  • 正文 為了忘掉前任向抢,我火速辦了婚禮认境,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘挟鸠。我一直安慰自己叉信,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,625評論 6 397
  • 文/花漫 我一把揭開白布艘希。 她就那樣靜靜地躺著硼身,像睡著了一般硅急。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上佳遂,一...
    開封第一講書人閱讀 52,255評論 1 308
  • 那天营袜,我揣著相機(jī)與錄音,去河邊找鬼丑罪。 笑死荚板,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的吩屹。 我是一名探鬼主播跪另,決...
    沈念sama閱讀 40,825評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼煤搜!你這毒婦竟也來了免绿?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,729評論 0 276
  • 序言:老撾萬榮一對情侶失蹤擦盾,失蹤者是張志新(化名)和其女友劉穎针姿,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體厌衙,經(jīng)...
    沈念sama閱讀 46,271評論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡距淫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,363評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了婶希。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片榕暇。...
    茶點(diǎn)故事閱讀 40,498評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖喻杈,靈堂內(nèi)的尸體忽然破棺而出彤枢,到底是詐尸還是另有隱情,我是刑警寧澤筒饰,帶...
    沈念sama閱讀 36,183評論 5 350
  • 正文 年R本政府宣布缴啡,位于F島的核電站,受9級特大地震影響瓷们,放射性物質(zhì)發(fā)生泄漏业栅。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,867評論 3 333
  • 文/蒙蒙 一谬晕、第九天 我趴在偏房一處隱蔽的房頂上張望碘裕。 院中可真熱鬧,春花似錦攒钳、人聲如沸帮孔。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽文兢。三九已至晤斩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間姆坚,已是汗流浹背尸昧。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留旷偿,地道東北人烹俗。 一個月前我還...
    沈念sama閱讀 48,906評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像萍程,于是被迫代替她去往敵國和親幢妄。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,507評論 2 359

推薦閱讀更多精彩內(nèi)容