ICLR 2019 | 采用輕量化及動態(tài)卷積替代注意力機制

Self-attention是建立語言及圖像生成模型的有效機制,其通過比較當前時間步中的各個元素钠怯,來決定上下文元素的重要程度。文中提出使用lightweight convolutions替代self-attention,結(jié)果表現(xiàn)的就很不錯芜辕。隨后提出了dynamic convolutions,此時卷積核將在當前時間步中通過函數(shù)生成簸喂,此方法與self-attention相比有較大提升毙死。并且這種方法所需要的計算量與輸入的長度呈線性增長,而自注意力則是呈二次增長的喻鳄。此方法在WMT’14 English-German 的測試集上的BLEU得分為29.7扼倘。

論文地址:

https://arxiv.org/abs/1901.10430

代碼地址:

https://github.com/pytorch/fairseq

引言

Dynamic convolution每個channel獨立進行卷積,注意到放到NLP任務(wù)上channel是指embedding的每一維除呵。每一層都有固定的window size再菊,這和self-attention不同。self-attention是所有的context都進行交互颜曾,使其計算的復雜度與輸入長度呈二次增長關(guān)系纠拔,在對長句子的計算上將極具挑戰(zhàn)性。

模型

其中泛豪,GLU(Gate Linear Units):$h_l = (X*W+b) \otimes \sigma(X*V+c)$

Depthwise convolutions

傳統(tǒng)的卷積核如下:

如果d_{in}=d_{out}=d稠诲,參數(shù)量為d^2k,其中k為卷積核的寬度诡曙。

為降低參數(shù)臀叙,采用如下depthwise convolutions。

如圖所示价卤,i=2匹耕,c=5k=3荠雕,O_{2,5}=W_{5,1:3}X_{1:3,5}稳其。

使用depthwise convolutions,可將參數(shù)量由d^2k降為dk炸卑,其中k為卷積核的寬度既鞠。

Lightweight convolutions

如圖所示,H=3盖文,X分割為3個區(qū)域嘱蛋,WX相同顏色區(qū)域進行相乘,共享參數(shù)五续。

通過Weight sharing洒敏,參數(shù)的數(shù)量繼續(xù)下降為Hk

Softmax-normalization 對channel一維進行softmax疙驾,相當于歸一化每個詞的每一維的的重要性(比self-attention更精細)凶伙。實驗證明,如果沒有softmax沒辦法收斂它碎。

Dynamic convolution

在每一個時間步中函荣,通過函數(shù)動態(tài)生成卷積核显押。

其中f:R^d \rightarrow R^{H \times k}f是一個線性映射傻挂,其中權(quán)重W^Q \in R^{H \times k \times d}乘碑,f(X_i)=\sum^d_{c=1}W^Q_{h,j,c}X_{i,c}

在動態(tài)生成卷積核時金拒,每個X_i對應(yīng)的權(quán)重W_i兽肤,將在當前時間步中通過函數(shù)映射生成。其中绪抛,右側(cè)圖為幫助理解轿衔,實際計算中并未進行view步驟。

模型替換

模型在transformer中的位置如下圖所示:

如圖所示睦疫,在encoder端害驹,使用LightCov或DynamicConv替代Multi-Head Attention;在decoder端蛤育,LightCov或DynamicConv替代第一層的Masked Multi-Head Attention宛官,并且將Mask放入第二層的。

結(jié)論

1.Lightweight convolution的權(quán)重盡量少并且在不同的時間步中是不變的瓦糕,但是結(jié)果已經(jīng)與現(xiàn)有文獻最佳結(jié)果相當底洗。

2.Dynamic convolution在不同的時間步中生成相應(yīng)的權(quán)重,這點與self-attention相似咕娄,但是函數(shù)只有當前時間步有關(guān)而不是整個上下文亥揖。

3.Ligthweight convolution 和 dynamic convolution 在運行時間上都不self-attention快20%。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 掃碼識別關(guān)注圣勒,獲取更多新鮮論文解讀

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末费变,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子圣贸,更是在濱河造成了極大的恐慌挚歧,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,084評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吁峻,死亡現(xiàn)場離奇詭異滑负,居然都是意外死亡,警方通過查閱死者的電腦和手機用含,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評論 3 392
  • 文/潘曉璐 我一進店門矮慕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人啄骇,你說我怎么就攤上這事痴鳄。” “怎么了肠缔?”我有些...
    開封第一講書人閱讀 163,450評論 0 353
  • 文/不壞的土叔 我叫張陵夏跷,是天一觀的道長哼转。 經(jīng)常有香客問我明未,道長槽华,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,322評論 1 293
  • 正文 為了忘掉前任趟妥,我火速辦了婚禮猫态,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘披摄。我一直安慰自己亲雪,他們只是感情好,可當我...
    茶點故事閱讀 67,370評論 6 390
  • 文/花漫 我一把揭開白布疚膊。 她就那樣靜靜地躺著义辕,像睡著了一般。 火紅的嫁衣襯著肌膚如雪寓盗。 梳的紋絲不亂的頭發(fā)上灌砖,一...
    開封第一講書人閱讀 51,274評論 1 300
  • 那天,我揣著相機與錄音傀蚌,去河邊找鬼基显。 笑死,一個胖子當著我的面吹牛善炫,可吹牛的內(nèi)容都是我干的撩幽。 我是一名探鬼主播,決...
    沈念sama閱讀 40,126評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼箩艺,長吁一口氣:“原來是場噩夢啊……” “哼窜醉!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起艺谆,我...
    開封第一講書人閱讀 38,980評論 0 275
  • 序言:老撾萬榮一對情侶失蹤酱虎,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后擂涛,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體读串,經(jīng)...
    沈念sama閱讀 45,414評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,599評論 3 334
  • 正文 我和宋清朗相戀三年撒妈,在試婚紗的時候發(fā)現(xiàn)自己被綠了恢暖。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,773評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡狰右,死狀恐怖杰捂,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情棋蚌,我是刑警寧澤嫁佳,帶...
    沈念sama閱讀 35,470評論 5 344
  • 正文 年R本政府宣布挨队,位于F島的核電站,受9級特大地震影響蒿往,放射性物質(zhì)發(fā)生泄漏盛垦。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,080評論 3 327
  • 文/蒙蒙 一瓤漏、第九天 我趴在偏房一處隱蔽的房頂上張望腾夯。 院中可真熱鬧,春花似錦蔬充、人聲如沸蝶俱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽榨呆。三九已至,卻和暖如春庸队,著一層夾襖步出監(jiān)牢的瞬間积蜻,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評論 1 269
  • 我被黑心中介騙來泰國打工皿哨, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留浅侨,地道東北人。 一個月前我還...
    沈念sama閱讀 47,865評論 2 370
  • 正文 我出身青樓证膨,卻偏偏與公主長得像如输,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子央勒,可洞房花燭夜當晚...
    茶點故事閱讀 44,689評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 陪孩子一起讀繪本不见,《一千零一夜》,淺顯中蘊含著人生哲學崔步,值得細細品味稳吮。 *001 阿拉丁神燈 勇敢的阿拉丁通過努力...
    玄子一一遇見最美閱讀 479評論 9 14
  • 一定要多畫,多看井濒,多學習灶似,多思考
    瘦曉白閱讀 396評論 0 1
  • 一、詠竹泉 讀罷詩友詠竹泉瑞你, 馬不停蹄奔沂南酪惭。 躋身竹泉恨來晚, 忘卻浮生憂和煩者甲。 泉溢清波漫街流春感, 竹隨高風靚姿...
    ZHOU春雨閱讀 330評論 1 5