綜述論文《Deep Learning for Generic Object Detection: A Survey》

論文翻譯PDF地址:鏈接:https://pan.baidu.com/s/1vddg6cNOTVfA4YoiJlUV5w 提取碼:vlu6镜悉。本文內(nèi)容也摘自論文翻譯最后總結(jié)的值得關(guān)注的點相赁,翻譯作者未知,若有任何侵權(quán)刊愚,請及時通知刪除。

本論文是對用于一般目標(biāo)檢測的深度學(xué)習(xí)的全面概述彻坛,凸顯了近些年取得的成就旁仿,并根據(jù)這些方法在檢測中的作用而提供了一個結(jié)構(gòu)化的分類,匯總了已有的常用數(shù)據(jù)集和評估指標(biāo)嫡秕,并還討論了大多數(shù)代表性方法的表現(xiàn)渴语。盡管過去幾年取得了巨大的成功(比如檢測準(zhǔn)確度從 ILSVRC2013 的 23%顯著提升至了 ILSVRC2017 的 73%),但當(dāng)前最佳方法的表現(xiàn)與人類水平仍有巨大差距昆咽,尤其是在開放世界學(xué)習(xí)任務(wù)上驾凶。還有很多研究工作有待完成,我們可以看到研究者的關(guān)注重點主要集中在以下八個領(lǐng)域:

1掷酗、開放世界學(xué)習(xí)(Open World Learning)

一般性目標(biāo)檢測的最終目標(biāo)是開發(fā)出能夠準(zhǔn)確调违,高效地識別和定位所有開放世界場景中所有對象類別(數(shù)千或更多對象類)實例的檢測系統(tǒng),與人類視覺系統(tǒng)達(dá)到相當(dāng)?shù)乃叫汉洹W罱哪繕?biāo)檢測算法是利用有限的數(shù)據(jù)集學(xué)習(xí)的技肩,目的是識別和定位數(shù)據(jù)集中包含的對象類別,但是無法識別數(shù)據(jù)集之外的其他對象類別浮声,盡管理想情況下強大的檢測系統(tǒng)應(yīng)該能夠認(rèn)識新穎的對象類別虚婿。當(dāng)前的檢測數(shù)據(jù)集僅包含數(shù)十個到數(shù)百個類別旋奢,這明顯小于人類可以識別的類別。為了實現(xiàn)這一目標(biāo)然痊,需要開發(fā)具有更多一般目標(biāo)檢測類別的新的大規(guī)模標(biāo)記數(shù)據(jù)集至朗,因為CNN 的良好性能需要大量數(shù)據(jù)來進(jìn)行良好的訓(xùn)練。然而玷过,收集如此大量的數(shù)據(jù)爽丹,特別是用于對象檢測的邊界框標(biāo)簽筑煮,是非常昂貴的辛蚊,尤其是對于數(shù)十萬個類別。

2真仲、更好更高效的檢測框架(Better and More Efficient Detection Frameworks)

一般性目標(biāo)檢測取得巨大成功的因素之一是開發(fā)了更好的檢測框架袋马,基于區(qū)域(RCNN, Fast RCNN秸应, Faster RCNN虑凛, Mask RCNN) 和一步檢測器(YOLO、SSD)软啼∩5基于區(qū)域的探測器具有最高的精度,但對于嵌入式或?qū)崟r系統(tǒng)來說計算量太大祸挪。一級探測器有可能更快更簡單锣披,但尚未達(dá)到基于區(qū)域的探測器的準(zhǔn)確性。一個可能的限制是贿条,現(xiàn)有技術(shù)的對象檢測器嚴(yán)重依賴于底層骨干網(wǎng)絡(luò)雹仿,該骨干網(wǎng)絡(luò)最初已經(jīng)針對圖像分類進(jìn)行了優(yōu)化,由于分類和檢測之間的差異而導(dǎo)致了學(xué)習(xí)偏差整以,因此一種潛在的策略是 從頭開始學(xué)習(xí)物體探測器胧辽,如 DSOD 探測器

3公黑、緊湊高效的深度 CNN 特征(Compact and Efficient Deep CNN Features)

在一般性目標(biāo)檢測方面取得長足進(jìn)步的另一個重要因素是強大的深層 CNN 的發(fā)展邑商,從幾層(例如, AlexNet)到數(shù)百層(例如 Res)凡蚜,其深度顯著增加人断。這些網(wǎng)絡(luò)擁有數(shù)百萬到數(shù)億個參數(shù),需要大量數(shù)據(jù)和耗電的 GPU 進(jìn)行培訓(xùn)番刊,這些都對其在實時/嵌入式應(yīng)用中產(chǎn)生了限制含鳞。因此,人們越來越關(guān)注緊湊和輕量級網(wǎng)絡(luò)芹务,網(wǎng)絡(luò)壓縮和加速以及網(wǎng)絡(luò)解釋和理解蝉绷。

4鸭廷、穩(wěn)健的目標(biāo)表征(Robust Object Representations)

使物體識別問題如此具有挑戰(zhàn)性的一個重要因素是真實世界圖像的巨大變化,包括視點和光照變化熔吗,物體尺度辆床,物體姿態(tài),物體部分變形桅狠,背景雜波讼载,遮擋,外觀變化中跌,圖像模糊咨堤, 年齡分辨率,噪音漩符,相機限制和扭曲一喘。盡管深度網(wǎng)絡(luò)取得了巨大的進(jìn)步,它們?nèi)匀皇艿竭@些許多變化缺乏魯棒性的限制嗜暴,這顯然限制了實際應(yīng)用的可用性凸克。

5、形境推理(Context Reasoning)

真實世界的對象通常與其他對象和環(huán)境共存闷沥。 已經(jīng)認(rèn)識到萎战,語境信息(對象關(guān)系,全局場景統(tǒng)計)有助于物體檢測和識別舆逃,特別是在小物體或遮擋物體的情況下或圖像質(zhì)量差的情況下蚂维。在深度學(xué)習(xí)之前有大量的工作,但是自從深度學(xué)習(xí)時代以來颖侄,在利用語境信息方面只取得了非常有限的進(jìn)展鸟雏。如何有效和有效地結(jié)合上下文信息仍有待探索,理想情況是由人類如何快速引導(dǎo)他們的注意力引導(dǎo)自然景觀中的感興趣對象引導(dǎo)览祖。

6孝鹊、目標(biāo)實例分割(Object Instance Segmentation)

一般性目標(biāo)檢測繼續(xù)朝著更豐富和更詳細(xì)的理解圖像內(nèi)容的趨勢發(fā)展(例如,從圖像分類到單個對象定位到對象檢測)展蒂,下一個挑戰(zhàn)是解決像素級對象實例分割又活,因為對象實例分割可以在許多需要單個實例的精確邊界的潛在應(yīng)用程序中發(fā)揮重要作用。

7锰悼、弱監(jiān)督或無監(jiān)督學(xué)習(xí)(Weakly Supervised or Unsupervised Learning)

當(dāng)前狀態(tài)的檢測器采用從帶有對象邊界框或分割掩模的標(biāo)記數(shù)據(jù)中學(xué)習(xí)的全監(jiān)督模型柳骄,然而這種完全監(jiān)督的學(xué)習(xí)具有嚴(yán)重的局限性,其中邊界框注釋的假設(shè)可能成為問題箕般,尤其是當(dāng)對象的類別數(shù)量很大時耐薯。在沒有完全標(biāo)記的訓(xùn)練數(shù)據(jù)的情況下,完全監(jiān)督學(xué)習(xí)是不可擴展的,因此研究如何在弱監(jiān)督或無監(jiān)督檢測中利用 CNN 的功效是有價值的曲初。

8体谒、三維目標(biāo)檢測(3D Object Detection)

深度相機的進(jìn)展可以以 RGB-Dimages 或 3D 點云的形式獲取深度信息。 深度模態(tài)可用于幫助對象檢測和識別臼婆,但是在方向上會是一個比較受限的問題抒痒,但是可能促使利用大量高質(zhì)量 CAD 模型的優(yōu)勢。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末颁褂,一起剝皮案震驚了整個濱河市故响,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌颁独,老刑警劉巖彩届,帶你破解...
    沈念sama閱讀 218,607評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異奖唯,居然都是意外死亡惨缆,警方通過查閱死者的電腦和手機糜值,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評論 3 395
  • 文/潘曉璐 我一進(jìn)店門丰捷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人寂汇,你說我怎么就攤上這事病往。” “怎么了骄瓣?”我有些...
    開封第一講書人閱讀 164,960評論 0 355
  • 文/不壞的土叔 我叫張陵停巷,是天一觀的道長。 經(jīng)常有香客問我榕栏,道長畔勤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,750評論 1 294
  • 正文 為了忘掉前任扒磁,我火速辦了婚禮庆揪,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘妨托。我一直安慰自己缸榛,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,764評論 6 392
  • 文/花漫 我一把揭開白布兰伤。 她就那樣靜靜地躺著内颗,像睡著了一般。 火紅的嫁衣襯著肌膚如雪敦腔。 梳的紋絲不亂的頭發(fā)上均澳,一...
    開封第一講書人閱讀 51,604評論 1 305
  • 那天,我揣著相機與錄音,去河邊找鬼找前。 笑死筒捺,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的纸厉。 我是一名探鬼主播系吭,決...
    沈念sama閱讀 40,347評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼颗品!你這毒婦竟也來了肯尺?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,253評論 0 276
  • 序言:老撾萬榮一對情侶失蹤躯枢,失蹤者是張志新(化名)和其女友劉穎则吟,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體锄蹂,經(jīng)...
    沈念sama閱讀 45,702評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡氓仲,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,893評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了得糜。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片敬扛。...
    茶點故事閱讀 40,015評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖朝抖,靈堂內(nèi)的尸體忽然破棺而出啥箭,到底是詐尸還是另有隱情,我是刑警寧澤治宣,帶...
    沈念sama閱讀 35,734評論 5 346
  • 正文 年R本政府宣布急侥,位于F島的核電站,受9級特大地震影響侮邀,放射性物質(zhì)發(fā)生泄漏坏怪。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,352評論 3 330
  • 文/蒙蒙 一绊茧、第九天 我趴在偏房一處隱蔽的房頂上張望铝宵。 院中可真熱鬧,春花似錦按傅、人聲如沸捉超。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,934評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽拼岳。三九已至,卻和暖如春况芒,著一層夾襖步出監(jiān)牢的瞬間惜纸,已是汗流浹背叶撒。 一陣腳步聲響...
    開封第一講書人閱讀 33,052評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留耐版,地道東北人祠够。 一個月前我還...
    沈念sama閱讀 48,216評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像粪牲,于是被迫代替她去往敵國和親古瓤。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,969評論 2 355

推薦閱讀更多精彩內(nèi)容