Bert在文本分類任務重如何進行 fine-tuning

1. 前言

文本分類是個經(jīng)典的NLP任務。隨著預訓練語言模型的大受歡迎旺入,諸如Bert等預訓練語言模型在文本分類任務上也有這十分出色的表現(xiàn)。這篇文章并沒有什么高深的tricks,只是最傳統(tǒng)的方式的簡單介紹茵瘾。
由于Bert本身并不會直接輸出文本類別礼华,因此需要對模型進行稍加改造,一般是Bert+Linear再通過softmax獲取最終的類別分布拗秘,因此就涉及到一些Bert部分的微調和Linear部分的訓練工作圣絮,本文接介紹一些用Bert做文本分類任務時的一些常用模型訓練技巧。

2. 關于Bert

關于Bert有幾個關鍵信息需要了解聘殖。
Bert是有Transformers的encoder部分構成的晨雳,包含多個encoder block的堆疊。Bert的輸入是一個不超過512個tokens的序列奸腺,輸出是這個序列的表征餐禁,中間層的hidden_size為768。在文本分類中突照,Bert一般用最后一層的[CLS]作為整個句子的表征帮非,再加個線性變換最終softmax成分別的分布。

3. 訓練

訓練一般有3種方式讹蘑。
【1】Bert 直接在特定任務上做訓練
【2】Bert在特定任務上進一步pre-train末盔,再在有l(wèi)abel數(shù)據(jù)上做訓練。
【3】Bert在進一步pre-train之后座慰,在multi-task fine-tuning陨舱,再在有l(wèi)abel的數(shù)據(jù)上做訓練。

3.1 Bert 直接在特定任務上做訓練

這一步是最基礎和關鍵的版仔。在這里我們需要學習率的選擇游盲。常用的方式是不同的層采用不同的學習率進行梯度更新。
\theta^l_t = \theta^l_{t-1} - \eta^l \cdot \bigtriangledown_{\theta^l} J(\theta),
其中\eta^l表示的是第l層的學習率蛮粮,我們首先設置一個初始學習率\eta^L益缎,然后用如下策略\eta^{k-1} = \xi \cdot \eta^k進行學習率的調整,其中\xi < 1然想,當然也可以等于1莺奔。

3.2 Bert在特定任務上進一步pre-train,再在有l(wèi)abel數(shù)據(jù)上做訓練变泄。

由于在做文本分類任務時令哟,往往是對特定領域的內容做分類,例如醫(yī)學文本妨蛹,商品評價等等屏富。因此我們可以用這個特定文本進行進一步的預訓練,得到一個新的Bert滑燃。這一部分參考Bert的訓練過程即可役听。

3.3 Bert在進一步pre-train之后,在multi-task fine-tuning,再在有l(wèi)abel的數(shù)據(jù)上做訓練典予。

Multi-task learning 也是一種十分有效的提升訓練效果的方式甜滨。


當然模型訓練還有很多其他的tricks可以借鑒,譬如對抗訓練瘤袖、r-drop等等衣摩。本文暫時對Bert用于文本分類的初學者做個簡單介紹。后邊的trick再慢慢補充捂敌。艾扮。。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末占婉,一起剝皮案震驚了整個濱河市泡嘴,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌逆济,老刑警劉巖酌予,帶你破解...
    沈念sama閱讀 206,378評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異奖慌,居然都是意外死亡抛虫,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評論 2 382
  • 文/潘曉璐 我一進店門简僧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來建椰,“玉大人,你說我怎么就攤上這事岛马∶藿悖” “怎么了?”我有些...
    開封第一講書人閱讀 152,702評論 0 342
  • 文/不壞的土叔 我叫張陵蛛枚,是天一觀的道長谅海。 經(jīng)常有香客問我脸哀,道長蹦浦,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,259評論 1 279
  • 正文 為了忘掉前任撞蜂,我火速辦了婚禮盲镶,結果婚禮上,老公的妹妹穿的比我還像新娘蝌诡。我一直安慰自己溉贿,他們只是感情好,可當我...
    茶點故事閱讀 64,263評論 5 371
  • 文/花漫 我一把揭開白布浦旱。 她就那樣靜靜地躺著宇色,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上宣蠕,一...
    開封第一講書人閱讀 49,036評論 1 285
  • 那天例隆,我揣著相機與錄音,去河邊找鬼抢蚀。 笑死镀层,一個胖子當著我的面吹牛,可吹牛的內容都是我干的皿曲。 我是一名探鬼主播唱逢,決...
    沈念sama閱讀 38,349評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼屋休!你這毒婦竟也來了坞古?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 36,979評論 0 259
  • 序言:老撾萬榮一對情侶失蹤劫樟,失蹤者是張志新(化名)和其女友劉穎绸贡,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體毅哗,經(jīng)...
    沈念sama閱讀 43,469評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡听怕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,938評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了虑绵。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片尿瞭。...
    茶點故事閱讀 38,059評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖翅睛,靈堂內的尸體忽然破棺而出声搁,到底是詐尸還是另有隱情,我是刑警寧澤捕发,帶...
    沈念sama閱讀 33,703評論 4 323
  • 正文 年R本政府宣布疏旨,位于F島的核電站,受9級特大地震影響扎酷,放射性物質發(fā)生泄漏檐涝。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,257評論 3 307
  • 文/蒙蒙 一法挨、第九天 我趴在偏房一處隱蔽的房頂上張望谁榜。 院中可真熱鬧,春花似錦凡纳、人聲如沸窃植。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽巷怜。三九已至葛超,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間延塑,已是汗流浹背巩掺。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留页畦,地道東北人胖替。 一個月前我還...
    沈念sama閱讀 45,501評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像豫缨,于是被迫代替她去往敵國和親独令。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,792評論 2 345

推薦閱讀更多精彩內容