Paper | Detecting?Twenty-thousand?Classes?using?Image-level?Supervision

寫在前面

  • 文章出處: ECCV 2022
  • 模型名字: Detic
  • 整體概括:這篇文章跟最開始的OVD-Net一樣,都是從pretraining的角度解決open vocabulary的問題桑阶,但是這篇文章的思路更加簡單粗暴柏副,直接加入imagenet的類別作為訓練。本質上不是真正的open vocabulary蚣录,但是能夠囊括2000類別割择;

1. Introduction:

  1. OD has two subtasks: 1) finding boxes (localization); 2) naming the boxes (classification)

  2. Previous works couple these two subtasks;

  3. however, the detection benchmarks are much smaller than the classification benchmark;

as in the fig, both the image number and the category number of LVIS (OD) are much smaller than ImageNet (CLS).

image.png

This paper:

propose a detector with image classes (Detic) that uses image-level supervision in addition to detection supervision.

  • decouple the localization and classification sub-problems;

  • use image-level labels to train the classifier and broaden the vocabulary of the detector;

illustration:

image.png

standard OD: need gt boxes and labels;

weakly supervised od: assign image-level labels to predicted boxes [error-prone]

this paper: assigns image-level labels to the max-size proposals.

2 Method

2.1 preliminary

  • detection dataset D_{det}, with class set C_{det}

  • image classification dataset D_{cls}, with class set C_{cls}

  • testing dataset with class set C_{test}.

  • C_{det}, C_{cls}, and C_{test} may or may not overlap.

tradional OD: C_{test} =C_{det},D_{cls} = \phi $

OVD: allows C_{test} \neq C_{det}

2.2 Detic

the whole idea is quite simple.

  • use both the detection dataset D_{det} and the classifiction dataset D_{cls} to train the detection model.
image.png
  1. sample a batch from both D_{det} and D_{cls}.

  2. if image belongs to D_{det}, then loss = typical od loss, rpn loss + rg loss + cls loss

  3. if image belongs to D_{cls}, then loss = max-size loss, max-size means the proposal has the max size is finally regarded as the region, then used to caculate the cls loss.

image.png
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末萎河,一起剝皮案震驚了整個濱河市荔泳,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌虐杯,老刑警劉巖玛歌,帶你破解...
    沈念sama閱讀 221,820評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異擎椰,居然都是意外死亡支子,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評論 3 399
  • 文/潘曉璐 我一進店門达舒,熙熙樓的掌柜王于貴愁眉苦臉地迎上來值朋,“玉大人叹侄,你說我怎么就攤上這事∽虻牵” “怎么了趾代?”我有些...
    開封第一講書人閱讀 168,324評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長丰辣。 經常有香客問我撒强,道長,這世上最難降的妖魔是什么糯俗? 我笑而不...
    開封第一講書人閱讀 59,714評論 1 297
  • 正文 為了忘掉前任尿褪,我火速辦了婚禮,結果婚禮上得湘,老公的妹妹穿的比我還像新娘杖玲。我一直安慰自己,他們只是感情好淘正,可當我...
    茶點故事閱讀 68,724評論 6 397
  • 文/花漫 我一把揭開白布摆马。 她就那樣靜靜地躺著,像睡著了一般鸿吆。 火紅的嫁衣襯著肌膚如雪囤采。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,328評論 1 310
  • 那天惩淳,我揣著相機與錄音蕉毯,去河邊找鬼。 笑死思犁,一個胖子當著我的面吹牛代虾,可吹牛的內容都是我干的。 我是一名探鬼主播激蹲,決...
    沈念sama閱讀 40,897評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼棉磨,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了学辱?” 一聲冷哼從身側響起乘瓤,我...
    開封第一講書人閱讀 39,804評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎策泣,沒想到半個月后衙傀,有當地人在樹林里發(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 46,345評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡着降,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,431評論 3 340
  • 正文 我和宋清朗相戀三年差油,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片任洞。...
    茶點故事閱讀 40,561評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡蓄喇,死狀恐怖,靈堂內的尸體忽然破棺而出交掏,到底是詐尸還是另有隱情妆偏,我是刑警寧澤,帶...
    沈念sama閱讀 36,238評論 5 350
  • 正文 年R本政府宣布盅弛,位于F島的核電站钱骂,受9級特大地震影響,放射性物質發(fā)生泄漏挪鹏。R本人自食惡果不足惜见秽,卻給世界環(huán)境...
    茶點故事閱讀 41,928評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望讨盒。 院中可真熱鬧解取,春花似錦、人聲如沸返顺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,417評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽遂鹊。三九已至振乏,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間秉扑,已是汗流浹背慧邮。 一陣腳步聲響...
    開封第一講書人閱讀 33,528評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留舟陆,地道東北人误澳。 一個月前我還...
    沈念sama閱讀 48,983評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像吨娜,于是被迫代替她去往敵國和親脓匿。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,573評論 2 359

推薦閱讀更多精彩內容