YOLOv3原理講解之論文中的關(guān)鍵點解讀

(1) mAP:mean average precision,每個類別各自的AP求和之后的平均值
VOC2010官方給出了如何計算mAP:
1). Compute a version of the measured precision/recall curve with precision monotonically decreasing, by setting the precision for recall r to the maximum precision obtained for any recall r′ ≥ r.
2). Compute the AP as the area under this curve by numerical integration. No approximation is involved since the curve is piecewise constant.
翻譯:
1). 計算PR曲線林螃,precision的取值為任意recall(r')大于或等于某個recall(r)對應(yīng)的precision最大值;
2). PR曲線的積分面積就是要計算的AP。

(2) Grid cell:用網(wǎng)格劃分圖片,也是一種先驗知識,即如果一個物體的中心落在某個cell中娩梨,那么這個cell就負(fù)責(zé)檢測該物體。也就是說每個cell要預(yù)測B個bounding box及其對應(yīng)的物體置信度和C個類別概率览徒。假設(shè)有N*N個cell,那么共有N*N*(B*(4+1+C))個輸出颂龙。4是4個坐標(biāo)(bounding box的左上角x习蓬,y,和bounding box的高措嵌,寬)躲叼,1是物體置信度(cell是否包含物體中心)。
在YOLOv1中企巢,網(wǎng)格劃分為7*7枫慷;在YOLOv2中,網(wǎng)格劃分為13*13浪规;在YOLOv3中或听,網(wǎng)格劃分為13*1326*26笋婿,52*52誉裆。輸入圖片的尺寸為416*416*3,那么對應(yīng)的就是32倍缸濒,16倍足丢,8倍下采樣,分別可以預(yù)測大庇配,中斩跌,小目標(biāo)物體。

(3) Bounding box的坐標(biāo)預(yù)測:方法還是沿用了YOLOv2捞慌,如下:
b_x=\sigma(t_x)+c_x
b_y=\sigma(t_y)+c_y
b_w=p_we^{t_w}
b_h=p_he^{t_h}

網(wǎng)絡(luò)對每個bounding box的四個坐標(biāo)進行預(yù)測(tx, ty, tw, th)耀鸦,再根據(jù)物體中心所在grid cell的左上角坐標(biāo)(cx, cy)以及bounding box的先驗寬和高(pw, ph)修正。這里再補充說明一下bounding box的先驗啸澡,其實就是anchor box揭糕。大家想一想,我們的bounding box要擬合的對象就明白作者指的先驗就是anchor box了锻霎。
這里有兩個trick:
a. sigmoid函數(shù)著角,將tx和ty轉(zhuǎn)換后限制到[0, 1]范圍內(nèi),這樣bx和by的值自然也就還是在當(dāng)前這個grid cell旋恼,不會跳到旁邊的cell中造成矛盾吏口;
b. exp(t?) 奄容,我比較同意參考1博主的觀點:主要是為了求導(dǎo)的計算。如果選擇類似p?*t?的方式产徊,可能后期會造成梯度消失或梯度不再更新昂勒。指數(shù)函數(shù)就不會出現(xiàn)這個問題,而且exp的導(dǎo)數(shù)是它自己舟铜,實在是我們的最佳選擇戈盈。指數(shù)函數(shù)還有個優(yōu)點就是它的值大于0,這樣我們就不用去要求預(yù)測的w和h要大于0谆刨。帶不等式約束的優(yōu)化問題塘娶,不能直接用SGD,還要用拉格朗日痊夭,個人認(rèn)為對深度學(xué)習(xí)不友好刁岸。

來看看原論文的示意圖,更加直觀:

bounding box帶尺寸先驗的坐標(biāo)預(yù)測

論文中提到訓(xùn)練過程中的一個trick:在數(shù)值預(yù)測中的損失函數(shù)梯度肯定是真實值減去預(yù)測值tgt-tpred她我。但是標(biāo)注并沒有tgt虹曙,我們可以通過計算bgt和tgt的反函數(shù),也就是用tgt與tpred來計算誤差番舆。
參考[1]提到我們可以不計算sigmoid的反函數(shù)酝碳,而是直接用sigmoid計算誤差,即:\sigma(tgt)=bgt-cgt恨狈。

(4) a. 論文提到的objectness score击敌,是用來判斷bounding box是否包含物體中心。也就是在測試的時候所說某個bounding box包含物體中心的置信度拴事。這里沿用YOLOv1的損失函數(shù)\lambda_{noobj}\sum_{i=0}^{s^2}\sum_{j=0}^{B}1_{ij}^{noobj}(c_i-\hat{c_i})^2+\lambda_{obj}\sum_{i=0}^{s^2}\sum_{j=0}^{B}1_{ij}^{obj}(c_i-\hat{c_i})^2
b. YOLOv3相較于YOLOv2還有一個大的改變就是每個bounding box可以預(yù)測多個類別沃斤,就是說一個box內(nèi)如果存在多個類別,也是可以識別出來的刃宵。作者僅僅使用了多個獨立的邏輯回歸來進行類別分析衡瓶。這么做的原因,作者在后面也說是因為某些數(shù)據(jù)本身就含有多標(biāo)簽牲证,比如woman和person哮针。如果使用softmax,那么就會認(rèn)為所有的類別是互斥的坦袍,結(jié)果上就會造成一個bounding box只能識別一個物體十厢。

好了,這是目前我想到的YOLOv3論文中的一些關(guān)鍵點的理解捂齐,如果大家還有什么疑惑蛮放,請給我留言。
接下來奠宜,我會一步一步搭建并解釋YOLOv3的pytorch代碼包颁,敬請期待瞻想!

參考:
[1]https://blog.csdn.net/weixin_43384257/article/details/100974776?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.add_param_isCf&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.add_param_isCf

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市娩嚼,隨后出現(xiàn)的幾起案子蘑险,更是在濱河造成了極大的恐慌,老刑警劉巖岳悟,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件佃迄,死亡現(xiàn)場離奇詭異,居然都是意外死亡贵少,警方通過查閱死者的電腦和手機呵俏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來春瞬,“玉大人,你說我怎么就攤上這事套啤】砥” “怎么了?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵潜沦,是天一觀的道長萄涯。 經(jīng)常有香客問我,道長唆鸡,這世上最難降的妖魔是什么涝影? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮争占,結(jié)果婚禮上燃逻,老公的妹妹穿的比我還像新娘。我一直安慰自己臂痕,他們只是感情好伯襟,可當(dāng)我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著握童,像睡著了一般姆怪。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上澡绩,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天稽揭,我揣著相機與錄音,去河邊找鬼肥卡。 笑死溪掀,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的步鉴。 我是一名探鬼主播膨桥,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼蛮浑,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了只嚣?” 一聲冷哼從身側(cè)響起沮稚,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎册舞,沒想到半個月后蕴掏,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡调鲸,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年盛杰,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片藐石。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡即供,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出于微,到底是詐尸還是另有隱情逗嫡,我是刑警寧澤,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布株依,位于F島的核電站驱证,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏恋腕。R本人自食惡果不足惜抹锄,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望荠藤。 院中可真熱鬧伙单,春花似錦、人聲如沸哈肖。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽牡彻。三九已至扫沼,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間庄吼,已是汗流浹背缎除。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留总寻,地道東北人器罐。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像渐行,于是被迫代替她去往敵國和親轰坊。 傳聞我的和親對象是個殘疾皇子铸董,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,554評論 2 349