優(yōu)雅の使用transformer系列之gpt2-chitchat

前言

?目前來說gpt2在生成式這塊效果還是比較突出的要糊。在嘗試 gpt2-chitchat 這個項目的時候梁棠,聊得挺好,首先感謝作者的貢獻,好像閑聊數(shù)據(jù)還@了我续扔。但是感覺代碼這塊還不夠優(yōu)雅答倡,所以就基于pytorch-lightning重寫了下。

gpt2-chitchat

?代碼傳送:gpt2-chitchat-pl
?關(guān)于模型介紹、效果展示可以直接訪問原作者的README.md辆它。我重寫之后有幾個參數(shù)這里說明下吧:

  • train_mmi: 默認是False誊薄,會訓(xùn)練dialogue_model;如果是設(shè)為True锰茉,就是訓(xùn)練mmi_model
  • use_pretrain: 默認是False呢蔫,意思是不使用預(yù)訓(xùn)練模型。如果設(shè)置為True的話飒筑,就需要將制定對應(yīng)的dialogue_model_path和mmi_model_path
  • dialogue_model_path: 這里可以下載 yangjianxin1 提供的dialogue_model片吊,然后指定對應(yīng)的路徑
  • mmi_model_path: 同dialogue_model_path一個意思
  • train_raw_path: 訓(xùn)練數(shù)據(jù)
  • model_config: gpt2 config配置文件
  • vocab_path: 字典文件

?當你設(shè)定好了對應(yīng)的參數(shù)后就可以重頭訓(xùn)練或者微調(diào)模型了

  • 重頭訓(xùn)練dialogue model
python train.py --train_mmi=False --use_pretrain=False
  • 微調(diào)dialogue model
python train.py --train_mmi=False --use_pretrain=True --dialogue_model_path=/path/to/dialogue_pre_model
  • 重頭訓(xùn)練mmi model
python train.py --train_mmi=True --use_pretrain=False
  • 微調(diào)mmi model
python train.py --train_mmi=True --use_pretrain=True --mmi_model_path=/path/to/mmi_pre_model

上面是訓(xùn)練模型的參數(shù)和命令。至于消費模型的代碼是run_interact.py协屡,對應(yīng)的參數(shù)有:

  • output_dir: 訓(xùn)練好模型的路徑
  • batch_size: 批量生成response的個數(shù), 然后經(jīng)過MMI模型進行篩選
    命令是:python run_interact.py --output_dir=/path/to/your/model_path

結(jié)束語

?具體的細節(jié)可以查看和調(diào)試代碼俏脊,感覺水了一篇文章。無論是dialogue model還是mmi model模型用的都是seq2seq著瓶,只不過輸入不一樣联予,至于多輪也就是把history用[SEP]拼接了一下,mmi將語料做了個翻轉(zhuǎn)材原,就醬(可能這就是使用框架帶來的便利吧沸久,減少了自己的關(guān)注點)。本來想寫一篇關(guān)于ner的余蟹,也是沒啥好說的卷胯,所以可以直接看代碼吧run_ner_pl.py,會存在個問題威酒,因為是直接使用的token classification窑睁,換成crf是否會好點。

Recommand

liveportraitweb
novelling

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末葵孤,一起剝皮案震驚了整個濱河市担钮,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌尤仍,老刑警劉巖箫津,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異宰啦,居然都是意外死亡苏遥,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門赡模,熙熙樓的掌柜王于貴愁眉苦臉地迎上來田炭,“玉大人,你說我怎么就攤上這事漓柑〗塘颍” “怎么了叨吮?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長瞬矩。 經(jīng)常有香客問我挤安,道長,這世上最難降的妖魔是什么丧鸯? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮嫩絮,結(jié)果婚禮上丛肢,老公的妹妹穿的比我還像新娘。我一直安慰自己剿干,他們只是感情好蜂怎,可當我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著置尔,像睡著了一般杠步。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上榜轿,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天幽歼,我揣著相機與錄音,去河邊找鬼谬盐。 笑死甸私,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的飞傀。 我是一名探鬼主播皇型,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼砸烦!你這毒婦竟也來了弃鸦?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤幢痘,失蹤者是張志新(化名)和其女友劉穎唬格,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體雪隧,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡西轩,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了脑沿。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片藕畔。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖庄拇,靈堂內(nèi)的尸體忽然破棺而出注服,到底是詐尸還是另有隱情韭邓,我是刑警寧澤,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布溶弟,位于F島的核電站女淑,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏辜御。R本人自食惡果不足惜鸭你,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望擒权。 院中可真熱鬧袱巨,春花似錦、人聲如沸碳抄。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽剖效。三九已至嫉入,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間璧尸,已是汗流浹背咒林。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留逗宁,地道東北人映九。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像瞎颗,于是被迫代替她去往敵國和親件甥。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,762評論 2 345