PERT-不再使用MLM任務(wù)的語言模型

論文標(biāo)題:PERT PRE-TRAINING BERT WITH PERMUTED LANGUAGE MODEL
論文鏈接:https://arxiv.org/abs/2203.06906

模型鏈接:https://github.com/ymcui/PERT

Abstract

本文提出了PERT,它主要用于NLU任務(wù)孵构,且是一個基于全排列的自編碼語言模型既绕。主要思路是對輸入文本的一部分進(jìn)行全排列赦政,訓(xùn)練目標(biāo)是預(yù)測出原始字符的位置璧瞬,同時也使用了WWM(全詞掩碼)與N-gram掩碼去提升PERT的性能。在中英文數(shù)據(jù)集上進(jìn)行了實驗沟沙,發(fā)現(xiàn)部分任務(wù)有明顯的提升嗡呼。

1.Introduction

預(yù)訓(xùn)練模型通常有兩種訓(xùn)練模式:以BERT為代表的自編碼方式和以GPT為代表的自回歸方式》磁ǎ基于MLM任務(wù)萌丈,有不少的改進(jìn)方式,比如WWM雷则,N-gram等辆雾,因此也誕生了ERNIE、RoBERTa月劈、ALBERT度迂、ELECTRA藤乙、MacBERT等模型。

本文探索了非MLM相關(guān)的預(yù)訓(xùn)練任務(wù)英岭,動機(jī)很有趣湾盒,很多諺語篡改幾個漢字不會影響你的閱讀。如圖1所示诅妹,打亂幾個字的順序罚勾,并不會改變?nèi)藗儗渥拥睦斫狻吭狡;诖讼敕庋辏疚奶岢隽艘粋€新的預(yù)訓(xùn)練任務(wù),permuted language model (PerLM)划煮,PerLM試圖從無序的句子中恢復(fù)字符的順序送丰,其目的是預(yù)測原始字符的位置

image

2.Related Work

相關(guān)工作直接貼個原文表格吧弛秋,各種預(yù)訓(xùn)練模型的特點表格已基本說明器躏。


image

3.PERT

3.1 Overview

PERT的輸入為亂序的句子,訓(xùn)練目標(biāo)是預(yù)測原始字符的位置蟹略。

  • PERT采用了和BERT一樣的切詞WordPiece登失、詞表等。
  • PERT沒有[MASK]字符挖炬。
  • 預(yù)測的空間是基于輸入的句子的揽浙,而不是整個詞表空間。
  • 由于PERT的主體與BERT相同意敛,通過適當(dāng)?shù)奈⒄{(diào)馅巷,BERT可以直接被PERT取代。
image

3.2 PERMUTED LANGUAGE MODEL

本文沒有使用NSP任務(wù)草姻,僅用了PerLM任務(wù)钓猬。

  • 本文使用了WWM與N-gram Mask進(jìn)行候選詞Mask的選擇,分別有40%撩独、30%敞曹、20%、10%的概率完成單字Mask到4-gram的Mask
  • 在前面的工作之后跌榔,本文使用了15%的輸入詞來進(jìn)行Mask。
    其中捶障,
    • 本文隨機(jī)選擇90%的字符并打亂它們的順序僧须。
    • 對于其余10%的字符,保持不變项炼,將其視為負(fù)樣本担平。

PerLM與MLM相比的特性如下:

  • PerLM沒有使用[MASK]字符示绊,緩解了預(yù)訓(xùn)練-微調(diào)之間的偏差問題。
  • 相比MLM任務(wù)暂论,PerLM預(yù)測空間是句子面褐,而不是整個詞表,比MLM任務(wù)效率更高取胎。

3.3 PRE-TRAINING STAGE

給定句子A和句子B展哭,完成隨機(jī)字符打亂之后,拼接在一起輸入到PERT中闻蛀。

image

經(jīng)過Embedding層與L層的Transformer結(jié)構(gòu)


image

PERT只需要去預(yù)測所選定的位置匪傍,最后經(jīng)過一個FFN與LayerNorm,使用softmax輸出標(biāo)準(zhǔn)化之后的概率分布,損失函數(shù)為交叉熵觉痛。

3.4 FINE-TUNING STAGE

微調(diào)階段PERT與BERT相似役衡,可以進(jìn)行直接替換,當(dāng)然薪棒,微調(diào)階段是不需要打亂句子的順序的手蝎,直接輸入原始句子就可以。

4 EXPERIMENTS ON CHINESE TASKS

具體訓(xùn)練參數(shù)俐芯,可以參考原論文棵介。

本文PERT在閱讀理解MRC,文本分類TC泼各,命名實體識別NER等任務(wù)中進(jìn)行了實驗鞍时。

image
image
image

在MRC與NER任務(wù)上,PERT表現(xiàn)還是不錯的扣蜻,即使在英文數(shù)據(jù)集上也是如此逆巍。

image

7.Conclusion

與MLM訓(xùn)練任務(wù)不同,本文提出的PERT訓(xùn)練目標(biāo)是預(yù)測被打亂字符的原始位置莽使。該模型在MRC于NER相關(guān)任務(wù)上有了不錯的提升锐极,但是文本分類沒有明顯提升。

最后值得一提的是芳肌,PERT在文本糾錯與亂序任務(wù)上表現(xiàn)不錯灵再,當(dāng)然這也和它預(yù)訓(xùn)練-微調(diào)任務(wù)一致性有很大的關(guān)系。前段時間科大訊飛比賽的一個題目亿笤,僅用PERT就比BERT翎迁、RoBERTa等模型性能要高不少。

image
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末净薛,一起剝皮案震驚了整個濱河市汪榔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌肃拜,老刑警劉巖痴腌,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件雌团,死亡現(xiàn)場離奇詭異,居然都是意外死亡士聪,警方通過查閱死者的電腦和手機(jī)锦援,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來剥悟,“玉大人灵寺,你說我怎么就攤上這事∨嘲” “怎么了替久?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長躏尉。 經(jīng)常有香客問我蚯根,道長,這世上最難降的妖魔是什么胀糜? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任颅拦,我火速辦了婚禮,結(jié)果婚禮上教藻,老公的妹妹穿的比我還像新娘距帅。我一直安慰自己,他們只是感情好括堤,可當(dāng)我...
    茶點故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布碌秸。 她就那樣靜靜地躺著,像睡著了一般悄窃。 火紅的嫁衣襯著肌膚如雪讥电。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天轧抗,我揣著相機(jī)與錄音恩敌,去河邊找鬼。 笑死横媚,一個胖子當(dāng)著我的面吹牛纠炮,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播灯蝴,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼恢口,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了穷躁?” 一聲冷哼從身側(cè)響起耕肩,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后看疗,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡睦授,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年两芳,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片去枷。...
    茶點故事閱讀 38,724評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡怖辆,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出删顶,到底是詐尸還是另有隱情竖螃,我是刑警寧澤,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布逗余,位于F島的核電站特咆,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏录粱。R本人自食惡果不足惜腻格,卻給世界環(huán)境...
    茶點故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望啥繁。 院中可真熱鬧菜职,春花似錦、人聲如沸旗闽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽适室。三九已至嫡意,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間亭病,已是汗流浹背鹅很。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留罪帖,地道東北人嗡官。 一個月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像琐鲁,于是被迫代替她去往敵國和親志膀。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,627評論 2 350

推薦閱讀更多精彩內(nèi)容