論文 | NeurIPS2019 Meta-Weight-Net: Learning an Explicit Mapping For SampleWeighting

一 寫在前面

未經(jīng)允許法牲,不得轉(zhuǎn)載矢否,謝謝~~~

今天這篇paper是NeurIPS2019的一篇paper邦马,雖然時間有點久了腥刹,但是看完paper還是有覺得值得借鑒的地方马胧,還是簡單記錄一下??。

二 主要內(nèi)容

2.1 backgrounds

deep learning容易對biased data產(chǎn)生過擬合的現(xiàn)象衔峰。

這里作者重點歸納了兩種biased data情況:

  1. noisy data 標(biāo)簽有噪聲數(shù)據(jù)
  2. long-tail data 長尾分布數(shù)據(jù)

這種過擬合自然會導(dǎo)致模型的生成泛化能力受到影響佩脊,而為了解決這個問題的一個思路就是進(jìn)行sample reweighting,也就是對不同的樣本設(shè)置不同的權(quán)重垫卤。 那reweighting的方法本質(zhì)要學(xué)習(xí)的就是從不同樣本到權(quán)重之間的映射關(guān)系威彰,然后通過最小化加權(quán)之后的損失函數(shù)來優(yōu)化模型參數(shù)。

2.2 related work

目前主要的sample reweighting方法可以分為兩大類:

  1. 以focal loss為代表:
  • 單樣本的loss越大 --> 認(rèn)為這個樣本更難分辨 --> 增加這個樣本的loss權(quán)重穴肘;
  • 經(jīng)典方法包括focal loss歇盼,AdaBoost,hard negative mining梢褐;
  • 這類方法主要適合用于解決long-tail數(shù)據(jù)旺遮,使得分布少的類別能擁有更高的權(quán)重;
  1. 以SPL為代表:
  • 單樣本的loss越小 --> 認(rèn)為該樣本的標(biāo)簽可信度更高 --> 增加這個樣本的loss權(quán)重盈咳;
  • 經(jīng)典方法包括SPL耿眉,iterative reweighting,以及其他變種方法鱼响;
  • 這類方法適合用于解決noisy data問題鸣剪,使得標(biāo)簽正確的樣本擁有更高的權(quán)重;

下圖以focal loss和SPL為例,直觀給出了兩類方法的差別筐骇,focal loss遞增债鸡,SPL遞減。


2.3 motivation

作者首先總結(jié)了現(xiàn)有方法的兩大缺點:
1) 在現(xiàn)實無法預(yù)知data具體分布(long-tail還是noisy)的情況下铛纬,不知道要選遞增型還是遞減型厌均。更何況,現(xiàn)實中可能出現(xiàn)的是long-tail并且noisy的數(shù)據(jù)分布告唆;
2) 不管是哪一類方法棺弊,都需要超參數(shù)。

針對以上兩點擒悬,該文的motivation就是能否設(shè)計一個自適應(yīng)的且不需要超參數(shù)的reweighting方法模她,即找到一種從loss到weight的映射關(guān)系。

三 文章方法 Meta-Weighting-Net (MW-Net)

3.1 key idea

為了提出這樣一個自適應(yīng)的且不需要超參數(shù)的reweighting方法懂牧,文章的主要想法是用MLP來充當(dāng)weight fucntion的作用侈净,即讓MLP自動學(xué)習(xí)從loss到weight之間的映射關(guān)系。然后用unbiased meta data來引導(dǎo)MLP的參數(shù)學(xué)習(xí)僧凤。

如下圖所示畜侦,文章確實可以做到可以同時處理不同分布的數(shù)據(jù)(long-tail/noisy)。


3.2 具體方法

記整個分類網(wǎng)絡(luò)為f(), 用于預(yù)測樣本loss權(quán)重的MLP網(wǎng)絡(luò)為\theta()拼弃, 網(wǎng)絡(luò)的整體訓(xùn)練過程如下圖:

可以重點關(guān)注箭頭的顏色夏伊,紅色的表示的是meta-weight-net的參數(shù)更新過程,而黑色的表示的整體分類網(wǎng)絡(luò)的參數(shù)更新過程吻氧。對于時間t而言,最重要的幾個步驟如下:

1) 對于分類網(wǎng)絡(luò)f的參數(shù)w咏连, 用從訓(xùn)練集中采出的minibatch data進(jìn)行網(wǎng)絡(luò)參數(shù)的更新盯孙,得到\hat w, 注意這里是暫時更新的\hat w,并沒有替換原來f的參數(shù)w祟滴,可以理解為是一個臨時變量振惰。(圖中step5)
2) 對于MLP網(wǎng)絡(luò)為\theta(),用當(dāng)前的\hat w預(yù)測得到的loss作為MLP網(wǎng)絡(luò)的輸入垄懂,得到輸出的loss weights骑晶,用meta-dataset構(gòu)建出來的minibatch data更新參數(shù)\theta, 得到t+1時刻的\theta草慧,替換原來\theta()中的網(wǎng)絡(luò)參數(shù)桶蛔。(圖中step6)
3) 用t+1時刻的\theta()和t時刻的w, 再次用訓(xùn)練集中采出的minibatch data進(jìn)行網(wǎng)絡(luò)參數(shù)的更新漫谷,得到w仔雷,這次的w才真正作為t+1時刻的w, 替換原來f()中的網(wǎng)絡(luò)參數(shù)。(圖中step7)

具體的公式可能看起來稍微有點復(fù)雜碟婆,但其實就是SGD在mini-batch上的優(yōu)化电抚。

最終的偽代碼如下所示:

四 寫在最后

整個思路還是比較巧妙的,而且之前的實驗結(jié)果圖也確實驗證了方法能對不同分布的數(shù)據(jù)都有效竖共。

目前還存在兩點問題:
1) meta-dataset具體什么怎么構(gòu)造的蝙叛,為什么在更新MLP的時候不能用正常的mini-batch,而要用meta-dataset公给;
2) 參數(shù)更新為什么一定要分3步借帘,直接a)更新w;2)更新\theta是不可以的嗎

太細(xì)節(jié)的地方可能沒有g(shù)et到妓布,歡迎知道的小伙伴多多交流姻蚓。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市匣沼,隨后出現(xiàn)的幾起案子狰挡,更是在濱河造成了極大的恐慌,老刑警劉巖释涛,帶你破解...
    沈念sama閱讀 219,188評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件加叁,死亡現(xiàn)場離奇詭異,居然都是意外死亡唇撬,警方通過查閱死者的電腦和手機(jī)它匕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來窖认,“玉大人豫柬,你說我怎么就攤上這事∑私” “怎么了烧给?”我有些...
    開封第一講書人閱讀 165,562評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長喝噪。 經(jīng)常有香客問我础嫡,道長,這世上最難降的妖魔是什么酝惧? 我笑而不...
    開封第一講書人閱讀 58,893評論 1 295
  • 正文 為了忘掉前任榴鼎,我火速辦了婚禮,結(jié)果婚禮上晚唇,老公的妹妹穿的比我還像新娘巫财。我一直安慰自己,他們只是感情好缺亮,可當(dāng)我...
    茶點故事閱讀 67,917評論 6 392
  • 文/花漫 我一把揭開白布翁涤。 她就那樣靜靜地躺著桥言,像睡著了一般。 火紅的嫁衣襯著肌膚如雪葵礼。 梳的紋絲不亂的頭發(fā)上号阿,一...
    開封第一講書人閱讀 51,708評論 1 305
  • 那天,我揣著相機(jī)與錄音鸳粉,去河邊找鬼扔涧。 笑死,一個胖子當(dāng)著我的面吹牛届谈,可吹牛的內(nèi)容都是我干的枯夜。 我是一名探鬼主播,決...
    沈念sama閱讀 40,430評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼艰山,長吁一口氣:“原來是場噩夢啊……” “哼湖雹!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起曙搬,我...
    開封第一講書人閱讀 39,342評論 0 276
  • 序言:老撾萬榮一對情侶失蹤摔吏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后纵装,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體征讲,經(jīng)...
    沈念sama閱讀 45,801評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,976評論 3 337
  • 正文 我和宋清朗相戀三年橡娄,在試婚紗的時候發(fā)現(xiàn)自己被綠了诗箍。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,115評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡挽唉,死狀恐怖滤祖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情瓶籽,我是刑警寧澤氨距,帶...
    沈念sama閱讀 35,804評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站棘劣,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏楞遏。R本人自食惡果不足惜茬暇,卻給世界環(huán)境...
    茶點故事閱讀 41,458評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望寡喝。 院中可真熱鬧糙俗,春花似錦、人聲如沸预鬓。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至劈彪,卻和暖如春竣蹦,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背沧奴。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評論 1 272
  • 我被黑心中介騙來泰國打工痘括, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人滔吠。 一個月前我還...
    沈念sama閱讀 48,365評論 3 373
  • 正文 我出身青樓纲菌,卻偏偏與公主長得像,于是被迫代替她去往敵國和親疮绷。 傳聞我的和親對象是個殘疾皇子翰舌,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,055評論 2 355

推薦閱讀更多精彩內(nèi)容