Hard Negtive

題目

試想有一份數(shù)據(jù)集,有99個(gè)負(fù)樣本语卤,1個(gè)正樣本∽反現(xiàn)在我們要學(xué)習(xí)一個(gè)模型,怎么學(xué)粹舵?

分析

看上去钮孵,直接學(xué),模型會(huì)擬合大量負(fù)樣本的特性眼滤。根本學(xué)不到正樣本的油猫。學(xué)到的模型,即使將所有樣本都預(yù)測(cè)為負(fù)樣本柠偶,都會(huì)取得很高的正確率情妖。 本質(zhì)上還是樣本不平衡問題。

怎么解決呢诱担?

Hard Negtive Mining

傳統(tǒng)的做法毡证,如SVM分類時(shí),首先訓(xùn)練一個(gè)模型蔫仙, 利用該模型將預(yù)測(cè)錯(cuò)誤的樣本加入料睛,認(rèn)為這部分樣本為Hard Negtive。
預(yù)測(cè)正確且置信度很高的樣本剔除摇邦,認(rèn)為這部分樣本為Easy Negtive恤煞。
這個(gè)過程很好理解, 就像我們上學(xué)時(shí)的錯(cuò)題本施籍,經(jīng)常會(huì)記入一些自己做錯(cuò)的居扒,或者不會(huì)做的題。同時(shí)會(huì)將一些簡(jiǎn)單的題丑慎,做對(duì)的題從作業(yè)本上劃掉喜喂。后面在復(fù)習(xí)時(shí),就直接跳過了竿裂。

方法改進(jìn)

  • 均衡交叉熵 Blanced CE


    Blance CE

    給不同的類別的樣本玉吁,在損失上增加不同的權(quán)重,以增加對(duì)該類別的重視腻异。

  • FocalLoss
    Focal Loss是Kaiming 大神團(tuán)隊(duì)在他們的論文Focal Loss for Dense Object Detection 提出來的損失函數(shù)进副,利用它改善了圖像物體檢測(cè)的效果。是從損失函數(shù)方面進(jìn)行改進(jìn)悔常,來改變樣本分布平衡狀態(tài)影斑。

    Kaiming 大神團(tuán)隊(duì)認(rèn)為上面的Hard Negtive Minging雖然增加了錯(cuò)分類樣本的權(quán)重曾沈,但是容易忽略容易分類的樣本。而 Blanced CE是一個(gè)超參鸥昏,還是不夠靈活,雖然能夠平衡 positive/negative 樣本的重要性姐帚,但不能區(qū)分 easy/had 樣本. 因此提出了Focal loss吏垮。

    Focal Loss是對(duì)交叉熵?fù)p失函數(shù)的一點(diǎn)小改造,經(jīng)過這種改造后罐旗,可以動(dòng)態(tài)的調(diào)整權(quán)重膳汪,具體表現(xiàn)為降低Easy分類樣本的權(quán)重,增加難分類樣本的權(quán)重九秀。

交叉熵函數(shù)本尊長(zhǎng)得下面這樣:

交叉熵

簡(jiǎn)寫一下遗嗽,就是下面這樣:
簡(jiǎn)化版

其實(shí)上面交叉熵的公式,當(dāng)y=0的時(shí)候鼓蜒,y^ 就是y=0的概率痹换,而1-y^ 也就是y=1的概率。就記著一句話都弹, log里面都是y=1的概率就可以了娇豫。所以這樣就可以統(tǒng)一成,簡(jiǎn)化版了畅厢,簡(jiǎn)化版中pt 就是 y=1 的預(yù)測(cè)概率冯痢。

再來看FocalLoss的公式:


FocalLoss

再來看看簡(jiǎn)化版:


簡(jiǎn)化版

跟上面交叉熵及簡(jiǎn)化版一樣,簡(jiǎn)單理解下框杜。

那么大神這么做能否 化腐朽為神奇浦楣,能否成為神來之筆?


曲線圖

r = 0時(shí)咪辱,是標(biāo)準(zhǔn)的傳統(tǒng)交叉熵振劳,為藍(lán)色曲線。
r =其他值時(shí)油狂,是藍(lán)色曲線下面的曲線澎迎。
可以發(fā)現(xiàn):
1)當(dāng)一個(gè)樣本被分錯(cuò)的時(shí)候,pt是很小的选调,那么調(diào)制因子(1-Pt)接近1夹供,無論r取多少,該樣本貢獻(xiàn)的損失基本不變仁堪,該怎么辦就怎么辦哮洽;
但是當(dāng)一個(gè)樣本分對(duì)了, Pt→1弦聂,那么(1-Pt)接近0鸟辅,而且在r次方下氛什,更接近于0了,這樣分對(duì)的樣本對(duì)損失貢獻(xiàn)為0匪凉,可以理解為沒啥貢獻(xiàn)了枪眉。
經(jīng)過,上面(1-pt)和r的調(diào)整后再层,相當(dāng)于增大了分錯(cuò)樣本的權(quán)重贸铜, 因?yàn)槠鋵?duì)損失貢獻(xiàn)大,地位重要聂受。 減弱了分對(duì)樣本的權(quán)重蒿秦,因?yàn)樗麑?duì)損失的貢獻(xiàn)小,地位很弱了蛋济」鞅睿總之,更加讓模型去重視那些易分錯(cuò)樣本碗旅,即Hard Negtive渡处, 否則承受著更大損失的增長(zhǎng)。

2) 參數(shù)γ平滑地調(diào)節(jié)了易分樣本調(diào)低權(quán)值的比例祟辟。γ增大能增強(qiáng)調(diào)制因子的影響骂蓖,實(shí)驗(yàn)發(fā)現(xiàn)γ取2最好。

focal loss的兩個(gè)性質(zhì)算是核心川尖,其實(shí)就是用一個(gè)合適的函數(shù)去度量難分類和易分類樣本對(duì)總的損失的貢獻(xiàn)登下。

樣本改進(jìn)

見本人之前分享的另一篇文章<采樣>

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市叮喳,隨后出現(xiàn)的幾起案子被芳,更是在濱河造成了極大的恐慌,老刑警劉巖馍悟,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件畔濒,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡锣咒,警方通過查閱死者的電腦和手機(jī)侵状,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來毅整,“玉大人趣兄,你說我怎么就攤上這事〉考担” “怎么了艇潭?”我有些...
    開封第一講書人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我蹋凝,道長(zhǎng)鲁纠,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任鳍寂,我火速辦了婚禮改含,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘迄汛。我一直安慰自己捍壤,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開白布隔心。 她就那樣靜靜地躺著,像睡著了一般尚胞。 火紅的嫁衣襯著肌膚如雪硬霍。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,708評(píng)論 1 305
  • 那天笼裳,我揣著相機(jī)與錄音唯卖,去河邊找鬼。 笑死躬柬,一個(gè)胖子當(dāng)著我的面吹牛拜轨,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播允青,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼橄碾,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了颠锉?” 一聲冷哼從身側(cè)響起法牲,我...
    開封第一講書人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎琼掠,沒想到半個(gè)月后拒垃,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡瓷蛙,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年悼瓮,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片艰猬。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡横堡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出冠桃,到底是詐尸還是另有隱情翅萤,我是刑警寧澤,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站套么,受9級(jí)特大地震影響培己,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜胚泌,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一省咨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧玷室,春花似錦零蓉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至津肛,卻和暖如春章喉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背身坐。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工秸脱, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人部蛇。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓摊唇,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親涯鲁。 傳聞我的和親對(duì)象是個(gè)殘疾皇子巷查,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容