論文筆記 --《CoLAKE: Contextualized Language and Knowledge Embedding》

標(biāo)簽: Jd_Paperweekly

時(shí)間:2020.11.05
來(lái)源: COLING 2020
關(guān)鍵詞:預(yù)訓(xùn)練模型姆涩,knowledge-Enhanced NLP, Knowledge Embedding赁还,GNN


1.背景及問(wèn)題描述

之前的一些knowledge-Enhanced預(yù)訓(xùn)練語(yǔ)言模型冻璃,一般都是使用淺層的榨惠、靜態(tài)的并且獨(dú)立訓(xùn)練的實(shí)體embedding薪伏,如TransE等将鸵,直接融入到預(yù)訓(xùn)練模型中界赔,并且實(shí)體embedding也不參與訓(xùn)練,他們之間是天然存在gap的雏吭。而一些task锁施,比如實(shí)體鏈接、關(guān)系抽取杖们,通常把相關(guān)的結(jié)構(gòu)化知識(shí)放進(jìn)模型中悉抵,會(huì)有更好的表現(xiàn)。所以摘完,本文作者試圖同時(shí)預(yù)訓(xùn)練非結(jié)構(gòu)化文本和結(jié)構(gòu)化知識(shí)姥饰。作者提出了 Contextualized Language and Knowledge Embedding (CoLAKE),即在同一語(yǔ)境中,將文本孝治、實(shí)體和關(guān)系構(gòu)造成一個(gè)圖結(jié)構(gòu)列粪,然后使用MLM(Mask Language Model)來(lái)同時(shí)預(yù)訓(xùn)練文本和知識(shí)审磁。

2.已有的解決方案

  1. Knowledge Representation Learning.

Knowledge Embedding (KE),傳統(tǒng)的方法就是使用實(shí)體和關(guān)系的三元組(h,r,t)岂座,學(xué)習(xí)一個(gè)靜態(tài)的低維向量态蒂,比如TransE,TranR等费什。這些方法的思路即使用前件(h)和關(guān)系(r)向量之和來(lái)預(yù)測(cè)后件(t)向量钾恢,向量之和從某種程度是表示的是信息的疊加,但是實(shí)體和關(guān)系或許不僅僅是信息的疊加而已鸳址。
因此最近出現(xiàn)的一些方法瘩蚪,比如:K-adapter,KEPLER氯质,同樣也是這個(gè)領(lǐng)域較新的兩個(gè)模型募舟。開(kāi)始考慮引入語(yǔ)境信息,使用子圖或者路徑作為訓(xùn)練預(yù)料闻察,在一些KG任務(wù)上取得了SOTA的效果拱礁。

  1. Joint Language and Knowledge Models

ERNIE 中使用的entity-embedding是直接使用TransE的結(jié)果,是靜態(tài)的辕漂。KnowBert只得到語(yǔ)言模型沒(méi)有同時(shí)訓(xùn)練實(shí)體表示呢灶。KEPLER,也是聯(lián)合學(xué)習(xí)語(yǔ)言模型和知識(shí)表示钉嘹,但是 KEPLER 不是直接學(xué)習(xí)每個(gè)實(shí)體的表示鸯乃,而是從實(shí)體描述(entity descriptions)中使用語(yǔ)言模型學(xué)習(xí)實(shí)體表示。
重要的是跋涣,上面的方法都沒(méi)有利用語(yǔ)境知識(shí)(contextualized knowledge)的潛力缨睡,這也是與本文方法的最大不同。

3.解決方案概述

1.構(gòu)建word-knowledge graph

word-knowledge graph

給定一段文本陈辱,首先對(duì)其分詞奖年,然后文本轉(zhuǎn)化為多個(gè)單詞節(jié)點(diǎn)全鏈接構(gòu)成的word graph。然后沛贪,我們其中的提及實(shí)體(mentions)的單詞節(jié)點(diǎn)替換成對(duì)應(yīng)的實(shí)體節(jié)點(diǎn)陋守,然后定義這類節(jié)點(diǎn)為anchor node
然后以這個(gè)anchor node為中心可以從圖譜中抽取出一個(gè)子圖利赋,然后將這個(gè)子圖和word graph在anchor node的位置拼接成一個(gè)完整的大圖水评,就得到了WK graph。實(shí)際操作中媚送,最多選取15個(gè)實(shí)體和關(guān)系來(lái)構(gòu)建子圖中燥,并且只考慮anchor node作為三元組的head(subject)的情況,并且子圖中實(shí)體不可以重復(fù)關(guān)系可以重復(fù)塘偎。

2.在graph上構(gòu)建模型

transformer模型

構(gòu)建好WK graph之后褪那,送到transformer中解碼幽纷。在embedding-layer和最后的目標(biāo)函數(shù)相比較BERT有所改變:

1.Embedding Layer

模型的輸入層是三個(gè)embedding做拼接式塌。

  • token embedding博敬,包含了詞、實(shí)體峰尝、關(guān)系三者偏窝,這也是本文模型可以直接學(xué)習(xí)entity-embedding和relation-embedding的設(shè)計(jì)。
  • type embedding武学,就是用來(lái)區(qū)分詞祭往、實(shí)體、關(guān)系的類別火窒。
  • position embedding硼补,這里作者采用soft-position,允許重復(fù)position的出現(xiàn),并且保證相同三元組的token在連續(xù)的位置熏矿。

2.Pre-Training Objective

  • Masking word nodes已骇,與BERT的MLM相同,只是因?yàn)閷?shí)在WK graph上解碼票编,所以預(yù)測(cè)時(shí)褪储,除了有語(yǔ)境只是還可以應(yīng)用到實(shí)體和關(guān)系的知識(shí)。
  • Masking entity nodes慧域,如果mask的是anchor node鲤竹,就是根據(jù)語(yǔ)境預(yù)測(cè)它,這樣可以把結(jié)構(gòu)知識(shí)和語(yǔ)境信息發(fā)給你在同一空間中學(xué)習(xí)昔榴。比如:圖中Harry_Potter實(shí)體的embedding與他的文本Harry Potter是相似的辛藻。如果不是anchor node,就是一些傳統(tǒng)的方法來(lái)學(xué)習(xí)entity-embedding互订。
  • Masking relation nodes吱肌,如果遮擋的relation是兩個(gè)anchor node之間,這就是一個(gè)監(jiān)督式關(guān)系抽取任務(wù)屁奏。否則岩榆,就是預(yù)測(cè)兩個(gè)相鄰實(shí)體之間的關(guān)系,一些傳統(tǒng)的方法坟瓢。這個(gè)任務(wù)作用:(1)學(xué)習(xí)實(shí)體關(guān)系(2)學(xué)習(xí)語(yǔ)境相關(guān)的relation-embedding勇边。

4.結(jié)果分析

  • 需要知識(shí)的下游文本任務(wù)上對(duì)CoLAKE進(jìn)行了測(cè)試,在Open Entity(Entity Typing), FewRel(Relation Extraction)等任務(wù)上都取得了不錯(cuò)的結(jié)果:
實(shí)驗(yàn)一
  • 在GLUE任務(wù)上表現(xiàn)一般:
實(shí)驗(yàn)二

5.創(chuàng)新點(diǎn)或貢獻(xiàn)

  • 在預(yù)訓(xùn)練語(yǔ)言模型的同時(shí)也學(xué)習(xí)一套知識(shí)表示折联,以在需要知識(shí)的下游文本任務(wù)上表現(xiàn)更好粒褒,例如實(shí)體鏈接、關(guān)系抽取等诚镰。
  • 在加入實(shí)體的同時(shí)也加入它的上下文(context)奕坟,允許模型在不同語(yǔ)境下關(guān)注實(shí)體的不同鄰居祥款,同時(shí)學(xué)習(xí)文本和知識(shí)的上下文表示。
  • 為了完成上述目標(biāo)月杉,作者提出來(lái)word-knowledge graph,提供了一種將文本和知識(shí)庫(kù)想結(jié)合表示成圖的思路刃跛,然后可以在圖上做MLM或者GNN的學(xué)習(xí)。

6.個(gè)人思考

  • 提供了一種將文本結(jié)合結(jié)構(gòu)化知識(shí)來(lái)構(gòu)建圖的思路苛萎,可以在此基礎(chǔ)上構(gòu)建GNN網(wǎng)絡(luò)桨昙。可以試試在這種思路來(lái)構(gòu)建sku的sku graph腌歉。
  • 這類knowledge-Enhanced的語(yǔ)言模型在GLUE任務(wù)上沒(méi)有明顯的提升蛙酪,我猜想是GLUE里的NLU任務(wù),對(duì)結(jié)構(gòu)化知識(shí)沒(méi)有那么依賴翘盖,更多需要是學(xué)習(xí)語(yǔ)境和推理的規(guī)律桂塞。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市馍驯,隨后出現(xiàn)的幾起案子阁危,更是在濱河造成了極大的恐慌,老刑警劉巖泥彤,帶你破解...
    沈念sama閱讀 210,978評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件欲芹,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡吟吝,警方通過(guò)查閱死者的電腦和手機(jī)菱父,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)剑逃,“玉大人浙宜,你說(shuō)我怎么就攤上這事∮蓟牵” “怎么了粟瞬?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,623評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)萤捆。 經(jīng)常有香客問(wèn)我裙品,道長(zhǎng),這世上最難降的妖魔是什么俗或? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,324評(píng)論 1 282
  • 正文 為了忘掉前任市怎,我火速辦了婚禮,結(jié)果婚禮上辛慰,老公的妹妹穿的比我還像新娘区匠。我一直安慰自己,他們只是感情好帅腌,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,390評(píng)論 5 384
  • 文/花漫 我一把揭開(kāi)白布驰弄。 她就那樣靜靜地躺著麻汰,像睡著了一般。 火紅的嫁衣襯著肌膚如雪戚篙。 梳的紋絲不亂的頭發(fā)上五鲫,一...
    開(kāi)封第一講書(shū)人閱讀 49,741評(píng)論 1 289
  • 那天,我揣著相機(jī)與錄音已球,去河邊找鬼臣镣。 笑死,一個(gè)胖子當(dāng)著我的面吹牛智亮,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播点待,決...
    沈念sama閱讀 38,892評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼阔蛉,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了癞埠?” 一聲冷哼從身側(cè)響起状原,我...
    開(kāi)封第一講書(shū)人閱讀 37,655評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎苗踪,沒(méi)想到半個(gè)月后颠区,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,104評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡通铲,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年毕莱,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片颅夺。...
    茶點(diǎn)故事閱讀 38,569評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡朋截,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出吧黄,到底是詐尸還是另有隱情部服,我是刑警寧澤,帶...
    沈念sama閱讀 34,254評(píng)論 4 328
  • 正文 年R本政府宣布拗慨,位于F島的核電站廓八,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏赵抢。R本人自食惡果不足惜剧蹂,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,834評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望昌讲。 院中可真熱鬧国夜,春花似錦、人聲如沸短绸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,725評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至窄驹,卻和暖如春朝卒,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背乐埠。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,950評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工抗斤, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人丈咐。 一個(gè)月前我還...
    沈念sama閱讀 46,260評(píng)論 2 360
  • 正文 我出身青樓瑞眼,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親棵逊。 傳聞我的和親對(duì)象是個(gè)殘疾皇子伤疙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,446評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容