論文｜ NeurIPS2019 Meta-Weight-Net: Learning an Explicit Mapping For SampleWeighting

一寫在前面

未經(jīng)允許法牲，不得轉(zhuǎn)載矢否，謝謝～～～

今天這篇paper是NeurIPS2019的一篇paper邦马，雖然時間有點久了腥刹，但是看完paper還是有覺得值得借鑒的地方马胧，還是簡單記錄一下??。

出處：NeurIPS2019
title： Meta-Weight-Net: Learning an Explicit Mapping For SampleWeighting
link： https://arxiv.org/pdf/1902.07379.pdf](https://arxiv.org/pdf/1902.07379.pdf

二主要內(nèi)容

2.1 backgrounds

deep learning容易對biased data產(chǎn)生過擬合的現(xiàn)象衔峰。

這里作者重點歸納了兩種biased data情況：

noisy data 標(biāo)簽有噪聲數(shù)據(jù)
long-tail data 長尾分布數(shù)據(jù)

這種過擬合自然會導(dǎo)致模型的生成泛化能力受到影響佩脊，而為了解決這個問題的一個思路就是進(jìn)行sample reweighting，也就是對不同的樣本設(shè)置不同的權(quán)重垫卤。那reweighting的方法本質(zhì)要學(xué)習(xí)的就是從不同樣本到權(quán)重之間的映射關(guān)系威彰，然后通過最小化加權(quán)之后的損失函數(shù)來優(yōu)化模型參數(shù)。

2.2 related work

目前主要的sample reweighting方法可以分為兩大類：

以focal loss為代表：

單樣本的loss越大 --> 認(rèn)為這個樣本更難分辨 --> 增加這個樣本的loss權(quán)重穴肘；
經(jīng)典方法包括focal loss歇盼，AdaBoost，hard negative mining梢褐；
這類方法主要適合用于解決long-tail數(shù)據(jù)旺遮，使得分布少的類別能擁有更高的權(quán)重；

以SPL為代表：

單樣本的loss越小 --> 認(rèn)為該樣本的標(biāo)簽可信度更高 --> 增加這個樣本的loss權(quán)重盈咳；
經(jīng)典方法包括SPL耿眉，iterative reweighting，以及其他變種方法鱼响；
這類方法適合用于解決noisy data問題鸣剪，使得標(biāo)簽正確的樣本擁有更高的權(quán)重；

下圖以focal loss和SPL為例，直觀給出了兩類方法的差別筐骇，focal loss遞增债鸡，SPL遞減。

2.3 motivation

作者首先總結(jié)了現(xiàn)有方法的兩大缺點：
1）在現(xiàn)實無法預(yù)知data具體分布（long-tail還是noisy）的情況下铛纬，不知道要選遞增型還是遞減型厌均。更何況，現(xiàn)實中可能出現(xiàn)的是long-tail并且noisy的數(shù)據(jù)分布告唆；
2）不管是哪一類方法棺弊，都需要超參數(shù)。

針對以上兩點擒悬，該文的motivation就是能否設(shè)計一個自適應(yīng)的且不需要超參數(shù)的reweighting方法模她，即找到一種從loss到weight的映射關(guān)系。

三文章方法 Meta-Weighting-Net （MW-Net）

3.1 key idea

為了提出這樣一個自適應(yīng)的且不需要超參數(shù)的reweighting方法懂牧，文章的主要想法是用MLP來充當(dāng)weight fucntion的作用侈净，即讓MLP自動學(xué)習(xí)從loss到weight之間的映射關(guān)系。然后用unbiased meta data來引導(dǎo)MLP的參數(shù)學(xué)習(xí)僧凤。

如下圖所示畜侦，文章確實可以做到可以同時處理不同分布的數(shù)據(jù)（long-tail/noisy）。

3.2 具體方法

記整個分類網(wǎng)絡(luò)為 $f()$ , 用于預(yù)測樣本loss權(quán)重的MLP網(wǎng)絡(luò)為 $\theta()$ 拼弃，網(wǎng)絡(luò)的整體訓(xùn)練過程如下圖：

可以重點關(guān)注箭頭的顏色夏伊，紅色的表示的是meta-weight-net的參數(shù)更新過程，而黑色的表示的整體分類網(wǎng)絡(luò)的參數(shù)更新過程吻氧。對于時間t而言，最重要的幾個步驟如下：

1）對于分類網(wǎng)絡(luò) $f$ 的參數(shù) $w$ 咏连，用從訓(xùn)練集中采出的minibatch data進(jìn)行網(wǎng)絡(luò)參數(shù)的更新盯孙，得到 $\hat w$ , 注意這里是暫時更新的 $\hat w$ ，并沒有替換原來 $f$ 的參數(shù) $w$ 祟滴，可以理解為是一個臨時變量振惰。（圖中step5）
2）對于MLP網(wǎng)絡(luò)為 $\theta()$ ，用當(dāng)前的 $\hat w$ 預(yù)測得到的loss作為MLP網(wǎng)絡(luò)的輸入垄懂，得到輸出的loss weights骑晶，用meta-dataset構(gòu)建出來的minibatch data更新參數(shù) $\theta$ ，得到t+1時刻的 $\theta$ 草慧，替換原來 $\theta()$ 中的網(wǎng)絡(luò)參數(shù)桶蛔。（圖中step6）
3）用t+1時刻的 $\theta()$ 和t時刻的 $w$ ，再次用訓(xùn)練集中采出的minibatch data進(jìn)行網(wǎng)絡(luò)參數(shù)的更新漫谷，得到 $w$ 仔雷，這次的 $w$ 才真正作為t+1時刻的 $w$ ，替換原來 $f()$ 中的網(wǎng)絡(luò)參數(shù)。（圖中step7）

具體的公式可能看起來稍微有點復(fù)雜碟婆，但其實就是SGD在mini-batch上的優(yōu)化电抚。

最終的偽代碼如下所示：

四寫在最后

整個思路還是比較巧妙的，而且之前的實驗結(jié)果圖也確實驗證了方法能對不同分布的數(shù)據(jù)都有效竖共。

目前還存在兩點問題：
1） meta-dataset具體什么怎么構(gòu)造的蝙叛，為什么在更新MLP的時候不能用正常的mini-batch，而要用meta-dataset公给；
2）參數(shù)更新為什么一定要分3步借帘，直接a）更新 $w$ ；2）更新 $\theta$ 是不可以的嗎

太細(xì)節(jié)的地方可能沒有g(shù)et到妓布，歡迎知道的小伙伴多多交流姻蚓。

最后編輯于：2021.12.08 19:43:15

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市匣沼，隨后出現(xiàn)的幾起案子狰挡，更是在濱河造成了極大的恐慌，老刑警劉巖释涛，帶你破解...
沈念sama閱讀 219,188評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件加叁，死亡現(xiàn)場離奇詭異，居然都是意外死亡唇撬，警方通過查閱死者的電腦和手機(jī)它匕，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,464評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來窖认，“玉大人豫柬，你說我怎么就攤上這事∑私” “怎么了烧给？”我有些...
開封第一講書人閱讀 165,562評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長喝噪。經(jīng)常有香客問我础嫡，道長，這世上最難降的妖魔是什么酝惧？我笑而不...
開封第一講書人閱讀 58,893評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任榴鼎，我火速辦了婚禮，結(jié)果婚禮上晚唇，老公的妹妹穿的比我還像新娘巫财。我一直安慰自己，他們只是感情好缺亮，可當(dāng)我...
茶點故事閱讀 67,917評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布翁涤。她就那樣靜靜地躺著桥言，像睡著了一般。火紅的嫁衣襯著肌膚如雪葵礼。梳的紋絲不亂的頭發(fā)上号阿，一...
開封第一講書人閱讀 51,708評論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音鸳粉，去河邊找鬼扔涧。笑死，一個胖子當(dāng)著我的面吹牛届谈，可吹牛的內(nèi)容都是我干的枯夜。我是一名探鬼主播，決...
沈念sama閱讀 40,430評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼艰山，長吁一口氣：“原來是場噩夢啊……” “哼湖雹！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起曙搬，我...
開封第一講書人閱讀 39,342評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤摔吏，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后纵装，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體征讲，經(jīng)...
沈念sama閱讀 45,801評論 1贊 317
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,976評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年橡娄，在試婚紗的時候發(fā)現(xiàn)自己被綠了诗箍。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,115評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡挽唉，死狀恐怖滤祖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情瓶籽，我是刑警寧澤氨距，帶...
沈念sama閱讀 35,804評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站棘劣，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏楞遏。R本人自食惡果不足惜茬暇，卻給世界環(huán)境...
茶點故事閱讀 41,458評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望寡喝。院中可真熱鬧糙俗，春花似錦、人聲如沸预鬓。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,008評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至劈彪，卻和暖如春竣蹦，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背沧奴。一陣腳步聲響...
開封第一講書人閱讀 33,135評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工痘括，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人滔吠。一個月前我還...
沈念sama閱讀 48,365評論 3贊 373
代替公主和親
正文我出身青樓纲菌，卻偏偏與公主長得像，于是被迫代替她去往敵國和親疮绷。傳聞我的和親對象是個殘疾皇子翰舌，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,055評論 2贊 355

論文 ｜ NeurIPS2019 Meta-Weight-Net: Learning an Explicit Mapping For SampleWeighting

一 寫在前面

二 主要內(nèi)容