清華ERNIE模型

2019年清華在ACL提出ERNIE模型,同年,百度也提出一個ERNIE模型。本篇論文主要針對的是清華的模型医清。
BERT模型在很多NLP任務(wù)中取得很好的效果,但是BERT模型只是就事論事卖氨,缺乏對知識的理解会烙。因此ERINE模型在輸入上加入了sentence存在于知識圖譜中的實體信息。比如’Bob is a writer.’筒捺,在bert中原始的輸入為[‘Bob’, ‘is’, ‘a(chǎn)’, ‘writer’, ‘.’]柏腻,ERINE加入的額外輸入為[‘Q191000’, ‘UNK’, ‘UNK’, ‘Q1910001’, ‘.’ ]。這里的’Q191000’系吭,‘Q1910001’是’Bob’葫盼、 'writer’這兩個實體的id。對于包含多個token的實體村斟,比如Jim Henson贫导,只會和第一個token Jim進(jìn)行對齊,因為作者假設(shè)模型會自動將實體信息傳遞到token上蟆盹。
ERNIE在Bert訓(xùn)練基礎(chǔ)上孩灯,都增加了預(yù)測MASK實體,但是原本標(biāo)注的實體信息可能存在錯誤逾滥,因此ENRIE采用了以下三個策略:

5%概率隨機(jī)替換實體峰档,以期模型可以糾正錯誤的實體對齊
15%概率mask掉實體败匹,以期模型可以抽取出沒有標(biāo)注的實體
80%概率,保留原來的實體讥巡,以期能夠?qū)嶓w與知識進(jìn)行融合掀亩,提高NLU效果
該模型的架構(gòu)如下圖所示:
在這里插入圖片描述

可以看到,該模型在T-Encoder上和bert是一樣的欢顷,但是K-Encoder上槽棍,ERNIE不僅包含原始的輸入,還假如了實體在知識圖譜中的信息抬驴。
根據(jù)原始代碼炼七,可以畫出如下的結(jié)構(gòu)圖:


在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
引用:像ERNIE那樣做個有知識的BERT
輸入token以及entities的enbedding后,分別用5層bertlayer_sim(T-Encoder布持,即原始的transformer)豌拙、1層bertlayermix(K-Encoder)、6層bertlayer(K-Encoder)得到最終輸出题暖。
在普通任務(wù)上按傅,bert和ERNIE模型的輸入是一樣的,但在實體相關(guān)的任務(wù)上胧卤,ERNIE需要經(jīng)過特殊處理唯绍。Entity Typing任務(wù)中,在實體兩端加入ENT這個token灌侣;在Relation Classification任務(wù)中,在頭部實體兩端加入HD這個token裂问,在尾部實體加入TL這個token侧啼。

————————————————
版權(quán)聲明:本文為CSDN博主「weixin_43178406」的原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權(quán)協(xié)議堪簿,轉(zhuǎn)載請附上原文出處鏈接及本聲明痊乾。
原文鏈接:https://blog.csdn.net/weixin_43178406/article/details/91047913

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市椭更,隨后出現(xiàn)的幾起案子哪审,更是在濱河造成了極大的恐慌,老刑警劉巖虑瀑,帶你破解...
    沈念sama閱讀 217,657評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件湿滓,死亡現(xiàn)場離奇詭異,居然都是意外死亡舌狗,警方通過查閱死者的電腦和手機(jī)叽奥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來痛侍,“玉大人朝氓,你說我怎么就攤上這事。” “怎么了赵哲?”我有些...
    開封第一講書人閱讀 164,057評論 0 354
  • 文/不壞的土叔 我叫張陵待德,是天一觀的道長。 經(jīng)常有香客問我枫夺,道長将宪,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,509評論 1 293
  • 正文 為了忘掉前任筷屡,我火速辦了婚禮涧偷,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘毙死。我一直安慰自己燎潮,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,562評論 6 392
  • 文/花漫 我一把揭開白布扼倘。 她就那樣靜靜地躺著确封,像睡著了一般。 火紅的嫁衣襯著肌膚如雪再菊。 梳的紋絲不亂的頭發(fā)上爪喘,一...
    開封第一講書人閱讀 51,443評論 1 302
  • 那天,我揣著相機(jī)與錄音纠拔,去河邊找鬼秉剑。 笑死,一個胖子當(dāng)著我的面吹牛稠诲,可吹牛的內(nèi)容都是我干的侦鹏。 我是一名探鬼主播,決...
    沈念sama閱讀 40,251評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼臀叙,長吁一口氣:“原來是場噩夢啊……” “哼略水!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起劝萤,我...
    開封第一講書人閱讀 39,129評論 0 276
  • 序言:老撾萬榮一對情侶失蹤渊涝,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后床嫌,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體跨释,經(jīng)...
    沈念sama閱讀 45,561評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,779評論 3 335
  • 正文 我和宋清朗相戀三年厌处,在試婚紗的時候發(fā)現(xiàn)自己被綠了煤傍。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,902評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡嘱蛋,死狀恐怖蚯姆,靈堂內(nèi)的尸體忽然破棺而出五续,到底是詐尸還是另有隱情,我是刑警寧澤龄恋,帶...
    沈念sama閱讀 35,621評論 5 345
  • 正文 年R本政府宣布疙驾,位于F島的核電站,受9級特大地震影響郭毕,放射性物質(zhì)發(fā)生泄漏它碎。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,220評論 3 328
  • 文/蒙蒙 一显押、第九天 我趴在偏房一處隱蔽的房頂上張望扳肛。 院中可真熱鬧,春花似錦乘碑、人聲如沸挖息。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽套腹。三九已至,卻和暖如春资铡,著一層夾襖步出監(jiān)牢的瞬間电禀,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人玻侥。 一個月前我還...
    沈念sama閱讀 48,025評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像政基,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子底洗,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,843評論 2 354

推薦閱讀更多精彩內(nèi)容