最強(qiáng)NLP模型-BERT

簡(jiǎn)介:

BERT,全稱(chēng)Bidirectional?Encoder?Representations from?Transformers,是一個(gè)預(yù)訓(xùn)練的語(yǔ)言模型,可以通過(guò)它得到文本表示,然后用于下游任務(wù),比如文本分類(lèi),問(wèn)答系統(tǒng),情感分析等任務(wù).BERT像是word2vec的加強(qiáng)版,同樣是預(yù)訓(xùn)練得到詞級(jí)別或者句子級(jí)別的向量表示,word2vec是上下文無(wú)關(guān)的(Context-Free),而B(niǎo)ERT是上下問(wèn)有關(guān)的(Contextual).意思就是,word2vec只是具有詞本身的語(yǔ)義信息,而沒(méi)有包含文本(不是特指某個(gè)文本,而是所有跟該詞相關(guān)的文本信息)上下文信息,BERT卻是相反的.目前為止,BERT已經(jīng)取得了所有NLP任務(wù)的最好結(jié)果,所以才稱(chēng)之為最強(qiáng)NLP模型.

以下是BERT的詳細(xì)介紹:

1.Mask-LM

傳統(tǒng)的一般形式語(yǔ)言模型,都是從前向后(從左到右)的得到文本的語(yǔ)義表示.

圖1

這樣得到的文本表示句子結(jié)尾處的詞可以包含前面詞的語(yǔ)義信息,但是前面的詞并有包含后面詞的語(yǔ)義信息.為了解決這一問(wèn)題,從而引出了雙向RNN結(jié)構(gòu)的模型(Bi-RNN/Bi-LSTM).但是如果模型加深,那么最后可能會(huì)形成一個(gè)"cycle"(作者原話),這是因?yàn)橐粚覤i-RNN會(huì)使前面的詞包含后面詞的語(yǔ)義,后面的詞包含前面詞的語(yǔ)義,那么一層一層的加深,每個(gè)詞都會(huì)包含整個(gè)句子的語(yǔ)義信息,最后加深就變成了自己包含自己的"cycle".

所以作者在這里并沒(méi)有使用循環(huán)神經(jīng)網(wǎng)絡(luò)架構(gòu),而是使用一種叫做Mask-LM的方法,使用Transformer進(jìn)行訓(xùn)練:
We mask out 15% of the words in the input, run the entire sequence through a deep bidirectional?Transformer?encoder, and then predict only the masked words. For example:

圖2

根據(jù)文中的意思很好理解Mask-LM的意思,就是隨機(jī)的去掉部分輸入句子的單詞,讓其作為要預(yù)測(cè)的label(相當(dāng)于完形填空),然后用雙向深度Transformer模型進(jìn)行訓(xùn)練.

2.Next Sentence Prediction

此外,為了學(xué)習(xí)句子之間的關(guān)系链瓦,作者還訓(xùn)練一個(gè)簡(jiǎn)單任務(wù):給出兩個(gè)句子A和B,B是A之后的實(shí)際下一個(gè)句子,或者只是語(yǔ)料庫(kù)中的隨機(jī)句子啦吧?也就是判斷句子B是不是句子A的下一個(gè)句子,是或者不是,這是一個(gè)二分類(lèi)問(wèn)題,稱(chēng)之為Next Sentence Prediction,它是BERT論文新提出的一項(xiàng)NLP任務(wù)奈偏,所以目前應(yīng)該沒(méi)有專(zhuān)門(mén)針對(duì)NSP的語(yǔ)料庫(kù).

圖3

3.模型結(jié)構(gòu)

BERT包括兩個(gè)步驟:預(yù)訓(xùn)練Pre-training和微調(diào)fine-tuning.預(yù)訓(xùn)練是要花費(fèi)很長(zhǎng)的時(shí)間,而且硬件要求也很高,作用使用了4到16個(gè)云TPU訓(xùn)練了4天,所以家里沒(méi)有礦的伙伴就直接使用預(yù)訓(xùn)練好的模型參數(shù)進(jìn)行微調(diào)吧.文章開(kāi)頭也說(shuō)了,BERT可以作為預(yù)訓(xùn)練模型,用于其他下游NLP任務(wù),所以只需要使用預(yù)訓(xùn)練好的模型參數(shù),加上微調(diào)就可以在常見(jiàn)的NLP任務(wù)上取得較好的效果.

作者給出了兩個(gè)主要模型:Basic-model,Large-model.分別有12層/768個(gè)神經(jīng)單元/12-heads/110M參數(shù)和24層/1024個(gè)神經(jīng)單元/16heads/340M參數(shù).以下是一些模型的其他release版本,其中uncased是指文本已經(jīng)分詞和小寫(xiě)處理.

圖4

作者強(qiáng)調(diào),BERT模型的硬件要求高,參數(shù)量較小的Basic-model也需要在12g-16g的GPU上才可以運(yùn)行(所以我也就只能看看文章--.).

模型更詳細(xì)的其他信息,可參考BERT代碼github:BERT

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末硝拧,一起剝皮案震驚了整個(gè)濱河市嘹履,隨后出現(xiàn)的幾起案子萍虽,更是在濱河造成了極大的恐慌齐疙,老刑警劉巖膜楷,帶你破解...
    沈念sama閱讀 206,482評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異贞奋,居然都是意外死亡赌厅,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,377評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)轿塔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)特愿,“玉大人仲墨,你說(shuō)我怎么就攤上這事∽嵴希” “怎么了目养?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,762評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)毒嫡。 經(jīng)常有香客問(wèn)我癌蚁,道長(zhǎng),這世上最難降的妖魔是什么兜畸? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,273評(píng)論 1 279
  • 正文 為了忘掉前任努释,我火速辦了婚禮,結(jié)果婚禮上咬摇,老公的妹妹穿的比我還像新娘伐蒂。我一直安慰自己,他們只是感情好菲嘴,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,289評(píng)論 5 373
  • 文/花漫 我一把揭開(kāi)白布饿自。 她就那樣靜靜地躺著,像睡著了一般龄坪。 火紅的嫁衣襯著肌膚如雪昭雌。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,046評(píng)論 1 285
  • 那天健田,我揣著相機(jī)與錄音烛卧,去河邊找鬼。 笑死妓局,一個(gè)胖子當(dāng)著我的面吹牛总放,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播好爬,決...
    沈念sama閱讀 38,351評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼局雄,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了存炮?” 一聲冷哼從身側(cè)響起炬搭,我...
    開(kāi)封第一講書(shū)人閱讀 36,988評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎穆桂,沒(méi)想到半個(gè)月后宫盔,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,476評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡享完,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,948評(píng)論 2 324
  • 正文 我和宋清朗相戀三年灼芭,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片般又。...
    茶點(diǎn)故事閱讀 38,064評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡彼绷,死狀恐怖巍佑,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情苛预,我是刑警寧澤句狼,帶...
    沈念sama閱讀 33,712評(píng)論 4 323
  • 正文 年R本政府宣布笋熬,位于F島的核電站热某,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏胳螟。R本人自食惡果不足惜昔馋,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,261評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望糖耸。 院中可真熱鬧秘遏,春花似錦、人聲如沸嘉竟。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,264評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)舍扰。三九已至倦蚪,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間边苹,已是汗流浹背陵且。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,486評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留个束,地道東北人慕购。 一個(gè)月前我還...
    沈念sama閱讀 45,511評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像茬底,于是被迫代替她去往敵國(guó)和親沪悲。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,802評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容