關(guān)于圖像分類中類別不平衡那些事

基于數(shù)據(jù)層面的方法

基于數(shù)據(jù)層面的方法主要對參與訓(xùn)練的數(shù)據(jù)集進(jìn)行相應(yīng)的處理幕与,以減少類別不平衡帶來的影響谎替。

Hensman等[2]提出了提升樣本(over sampling)的方法凳忙,即對于類別數(shù)目較少的類別,從中隨機(jī)選擇一些圖片進(jìn)行復(fù)制并添加至該類別包含的圖像內(nèi),直到這個類別的圖片數(shù)目和最大數(shù)目類的個數(shù)相等為止。通過實驗發(fā)現(xiàn)步淹,這一方法對最終的分類結(jié)果有了非常大的提升。

Lee等[3]提出了一種兩階段(two-phase)訓(xùn)練法诚撵。首先根據(jù)數(shù)據(jù)集分布情況設(shè)置一個閾值N缭裆,通常為最少類別所包含樣例個數(shù)。隨后對樣例個數(shù)大于閾值的類別進(jìn)行隨機(jī)抽取寿烟,直到達(dá)到閾值澈驼。此時根據(jù)閾值抽取的數(shù)據(jù)集作為第一階段的訓(xùn)練樣本進(jìn)行訓(xùn)練,并保存模型參數(shù)筛武。最后采用第一階段的模型作為預(yù)訓(xùn)練數(shù)據(jù)缝其,再在整個數(shù)據(jù)集上進(jìn)行訓(xùn)練,對最終的分類結(jié)果有了一定的提升.

Pouyanfar等[4]則提出了一種動態(tài)采樣(dynamic sampling)的方法徘六。該方法借鑒了提升樣本的思想内边,將根據(jù)訓(xùn)練結(jié)果對數(shù)據(jù)集進(jìn)行動態(tài)調(diào)整,對結(jié)果較好的類別進(jìn)行隨機(jī)刪除樣本操作硕噩,對結(jié)果較差的類別進(jìn)行隨機(jī)復(fù)制操作假残,以保證分類模型每次學(xué)習(xí)都能學(xué)到相關(guān)的信息缭贡。

基于算法層面的方法

基于算法層面的方法主要對現(xiàn)有的深度學(xué)習(xí)算法進(jìn)行改進(jìn)炉擅,通過修改損失函數(shù)或?qū)W習(xí)方式的方法來消除類別不平衡帶來的影響辉懒。

Wang等[5]提出mean squared false error (MSFE) loss。這一新的損失函數(shù)是在mean false error (MFE) loss的基礎(chǔ)上進(jìn)行改進(jìn)谍失,具體公式如下圖所示:

image.png

MSFE loss能夠很好地平衡正反例之間的關(guān)系眶俩,從而實現(xiàn)更好的優(yōu)化結(jié)果。

Buda等[6]提出輸出閾值(output thresholding)的方法快鱼,通過調(diào)整網(wǎng)絡(luò)結(jié)果的輸出閾值來改善類別不平衡的問題颠印。模型設(shè)計者根據(jù)數(shù)據(jù)集的構(gòu)成和輸出的概率值,人工設(shè)計一個合理的閾值抹竹,以降低樣本數(shù)目較少的類別的輸出要求线罕,使得其預(yù)測結(jié)果更加合理。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末窃判,一起剝皮案震驚了整個濱河市钞楼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌袄琳,老刑警劉巖询件,帶你破解...
    沈念sama閱讀 212,383評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異唆樊,居然都是意外死亡宛琅,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,522評論 3 385
  • 文/潘曉璐 我一進(jìn)店門逗旁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嘿辟,“玉大人,你說我怎么就攤上這事痢艺〔滞荩” “怎么了?”我有些...
    開封第一講書人閱讀 157,852評論 0 348
  • 文/不壞的土叔 我叫張陵堤舒,是天一觀的道長色建。 經(jīng)常有香客問我,道長舌缤,這世上最難降的妖魔是什么箕戳? 我笑而不...
    開封第一講書人閱讀 56,621評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮国撵,結(jié)果婚禮上陵吸,老公的妹妹穿的比我還像新娘。我一直安慰自己介牙,他們只是感情好壮虫,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,741評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般囚似。 火紅的嫁衣襯著肌膚如雪剩拢。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,929評論 1 290
  • 那天饶唤,我揣著相機(jī)與錄音徐伐,去河邊找鬼。 笑死募狂,一個胖子當(dāng)著我的面吹牛办素,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播祸穷,決...
    沈念sama閱讀 39,076評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼性穿,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了雷滚?” 一聲冷哼從身側(cè)響起季二,我...
    開封第一講書人閱讀 37,803評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎揭措,沒想到半個月后胯舷,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,265評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡绊含,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,582評論 2 327
  • 正文 我和宋清朗相戀三年桑嘶,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片躬充。...
    茶點(diǎn)故事閱讀 38,716評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡逃顶,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出充甚,到底是詐尸還是另有隱情以政,我是刑警寧澤,帶...
    沈念sama閱讀 34,395評論 4 333
  • 正文 年R本政府宣布伴找,位于F島的核電站盈蛮,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏技矮。R本人自食惡果不足惜抖誉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,039評論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望衰倦。 院中可真熱鬧袒炉,春花似錦、人聲如沸樊零。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至夺艰,卻和暖如春叛溢,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背劲适。 一陣腳步聲響...
    開封第一講書人閱讀 32,027評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留厢蒜,地道東北人霞势。 一個月前我還...
    沈念sama閱讀 46,488評論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像斑鸦,于是被迫代替她去往敵國和親愕贡。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,612評論 2 350

推薦閱讀更多精彩內(nèi)容

  • 機(jī)器學(xué)習(xí)術(shù)語表 本術(shù)語表中列出了一般的機(jī)器學(xué)習(xí)術(shù)語和 TensorFlow 專用術(shù)語的定義巷屿。 A A/B 測試 (...
    yalesaleng閱讀 1,960評論 0 11
  • 機(jī)器學(xué)習(xí) 經(jīng)驗 數(shù)據(jù) 數(shù)據(jù)中產(chǎn)生模型model 的算法 學(xué)習(xí)算法 learning algorithm 數(shù)據(jù)集 d...
    時待吾閱讀 3,970評論 0 3
  • 本文編譯自谷歌開發(fā)者機(jī)器學(xué)習(xí)術(shù)語表項目固以,介紹了該項目所有的術(shù)語與基本解釋。 A 準(zhǔn)確率(accuracy) 分類模...
    630d0109dd74閱讀 1,987評論 0 1
  • ted:夠好的人生選擇 人生的意義是什么嘱巾? 人生就 是抉擇憨琳,因為我們的人生充滿了選擇,每天都會在成千上百選擇旬昭,也在...
    幻想家Melon閱讀 249評論 1 2
  • 1篙螟、自定義內(nèi)部類2、匿名內(nèi)部類3问拘、當(dāng)前activity去實現(xiàn)事件接口4遍略、在布局文件xml中添加點(diǎn)擊事件屬性(使用頻...
    光明程輝閱讀 352評論 0 0