筆記:LogME售貌,一種通用快速準(zhǔn)確的預(yù)訓(xùn)練模型評估方法

發(fā)現(xiàn)鏈接: https://hub.baai.ac.cn/activity/details/136

1.論文題目:LogME: Practical Assessment of Pre-trained Models for Transfer Learning

論文鏈接:arxiv.org/abs/2102.11005
摘要:本文研究任務(wù)自適應(yīng)預(yù)訓(xùn)練模型選擇,這是一個未深入研究的評估預(yù)訓(xùn)練模型的問題囤锉,以便無需微調(diào)就可以從模型庫中選擇適合該任務(wù)的模型丈莺。一項試點(diǎn)工作(Nguyen等人,2020年)解決了將監(jiān)督預(yù)訓(xùn)練模型轉(zhuǎn)移到分類任務(wù)的問題拐迁,但它不能處理新出現(xiàn)的無監(jiān)督預(yù)訓(xùn)練模型或回歸任務(wù)蹭劈。為了尋求一種實用的評估方法,我們建議在給定由預(yù)先訓(xùn)練的模型提取的特征的情況下线召,估計標(biāo)簽的最大證據(jù)(邊際似然)铺韧。最大證據(jù)比似然法更不容易過度擬合,并且通過我們精心設(shè)計的算法可以顯著減少其昂貴的計算缓淹。最大證據(jù)對數(shù)(LogME)可用于評估遷移學(xué)習(xí)的預(yù)訓(xùn)練模型:具有高LogME的預(yù)訓(xùn)練模型可能具有良好的遷移性能哈打。LogME快速、準(zhǔn)確讯壶、通用料仗,是第一種實用的遷移學(xué)習(xí)評估方法。與強(qiáng)力微調(diào)相比伏蚊,LogME在掛鐘時間內(nèi)帶來了3000倍以上的加速立轧。它在設(shè)置方面優(yōu)于現(xiàn)有方法,并且適用于現(xiàn)有方法無法處理的新設(shè)置丙挽。它足夠通用于不同的預(yù)訓(xùn)練模型(有監(jiān)督的預(yù)訓(xùn)練和無監(jiān)督的預(yù)訓(xùn)練)肺孵、下游任務(wù)(分類和回歸)和模態(tài)(視覺和語言)。

論文詳細(xì)介紹:https://mp.weixin.qq.com/s/9lJEcwkXAN4jaENNghjpyw

2.【題目】Random Feature Attention

【作者】Hao Peng, Nikolaos Pappas, Dani Yogatama, Roy Schwartz, Noah A. Smith, Lingpeng Kong
【時間】3 Mar 2021颜阐, ICLR 2021
【推薦理由】本文提出了RFA平窘,一種線性時間和空間復(fù)雜度的注意力機(jī)制。使用隨機(jī)特征方法來近似softmax函數(shù)凳怨,并探討了它在Transformer中的應(yīng)用瑰艘。

Transformer是用于各種序列建模任務(wù)的最先進(jìn)模型。核心是注意力機(jī)制肤舞,在每個時間步對輸入之間的相互作用進(jìn)行建模紫新。注意力機(jī)制在序列長度上的二次時間和空間復(fù)雜性,不能有效地擴(kuò)展到長序列李剖。RFA可以作為常規(guī)softmax注意力的替代芒率,并通過可選的門控機(jī)制提供了一種直接的學(xué)習(xí)近因偏差的方式。在語言建模和機(jī)器翻譯方面的實驗表明篙顺,相對于基線偶芍,RFA具有相似或更好的性能充择。在機(jī)器翻譯實驗中,RFA的解碼速度是普通模型的兩倍匪蟀。相對于現(xiàn)有的高效Transformer椎麦,RFA在三個長文本分類數(shù)據(jù)集上的準(zhǔn)確性和效率都具有競爭力。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末材彪,一起剝皮案震驚了整個濱河市观挎,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌段化,老刑警劉巖嘁捷,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異显熏,居然都是意外死亡普气,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進(jìn)店門佃延,熙熙樓的掌柜王于貴愁眉苦臉地迎上來现诀,“玉大人,你說我怎么就攤上這事履肃∽醒兀” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵尺棋,是天一觀的道長封锉。 經(jīng)常有香客問我,道長膘螟,這世上最難降的妖魔是什么成福? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮荆残,結(jié)果婚禮上奴艾,老公的妹妹穿的比我還像新娘。我一直安慰自己内斯,他們只是感情好蕴潦,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著俘闯,像睡著了一般潭苞。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上真朗,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天此疹,我揣著相機(jī)與錄音,去河邊找鬼。 笑死蝗碎,一個胖子當(dāng)著我的面吹牛振诬,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播衍菱,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼肩豁!你這毒婦竟也來了脊串?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤清钥,失蹤者是張志新(化名)和其女友劉穎琼锋,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體祟昭,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡缕坎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了篡悟。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片谜叹。...
    茶點(diǎn)故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖搬葬,靈堂內(nèi)的尸體忽然破棺而出荷腊,到底是詐尸還是另有隱情,我是刑警寧澤急凰,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布女仰,位于F島的核電站,受9級特大地震影響抡锈,放射性物質(zhì)發(fā)生泄漏疾忍。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一床三、第九天 我趴在偏房一處隱蔽的房頂上張望一罩。 院中可真熱鬧,春花似錦撇簿、人聲如沸擒抛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽歧沪。三九已至,卻和暖如春莲组,著一層夾襖步出監(jiān)牢的瞬間诊胞,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留撵孤,地道東北人迈着。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像邪码,于是被迫代替她去往敵國和親裕菠。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容