Yolo V3詳解

姓名：李澤銘? ? ? ? ? 學(xué)號：22011210787? ? ? ? ? 通信工程學(xué)院

轉(zhuǎn)載自:YOLO v3 詳解_*青云*的博客-CSDN博客_yolov3介紹

【嵌牛導(dǎo)讀】YOLO v3 是目前工業(yè)界用的非常多的目標(biāo)檢測的算法。YOLO v3 沒有太多的創(chuàng)新琴锭，主要是借鑒一些好的方案融合到 YOLO v2 里面力奋。不過效果還是不錯的掰读，在保持速度優(yōu)勢的前提下采盒，提升了預(yù)測精度软免，尤其是加強(qiáng)了對小物體的識別能力贰军。

【嵌牛鼻子】Yolo V3植兰；卷積神經(jīng)網(wǎng)絡(luò)份帐；

【嵌牛提問】? ? Yolo V3相比其他類型的卷積神經(jīng)網(wǎng)絡(luò)，優(yōu)勢具體體現(xiàn)在哪里楣导？

【嵌牛正文】

一废境、核心思想

圖 1：多種尺度網(wǎng)格

? ? ?YOLO v3 的核心思想就是用 3 種不同的網(wǎng)格來劃分原始圖像。其中 13 * 13 的網(wǎng)格劃分的每一塊最大筒繁，用于預(yù)測大物體彬坏。26 * 26 的網(wǎng)格劃分的每一塊中等大小，用于預(yù)測中等物體膝晾。52 * 52 的網(wǎng)格劃分的每一塊最小栓始，用于預(yù)測小物體。

二血当、Darknet-53

圖 2：Darknet-53 網(wǎng)絡(luò)結(jié)構(gòu)

YOLO v3 的 backbone 采用了自己設(shè)計的 Darknet-53 的網(wǎng)絡(luò)結(jié)構(gòu)（含有53個卷積層）幻赚，它借鑒了殘差網(wǎng)絡(luò) residual network 的做法禀忆，在一些層之間設(shè)置了快捷鏈路（shortcut connections）。

??上圖的 Darknet-53 網(wǎng)絡(luò)采用 256 * 256 * 3 作為輸入落恼，最左側(cè)那一列的 1箩退、2、8 等數(shù)字表示多少個重復(fù)的殘差組件佳谦。每個殘差組件有兩個卷積層和一個快捷鏈路戴涝，示意圖如下：

圖 3：殘差組件

三、網(wǎng)絡(luò)結(jié)構(gòu)

圖 4：YOLO v3 網(wǎng)絡(luò)結(jié)構(gòu)

YOLO v2 曾采用 passthrough 結(jié)構(gòu)來檢測細(xì)粒度特征钻蔑，在 YOLO v3 更進(jìn)一步采用了 3 個不同尺度的特征圖來進(jìn)行對象檢測啥刻。

??結(jié)合上圖看，卷積網(wǎng)絡(luò)在 79 層后咪笑，經(jīng)過下方幾個黃色的卷積層得到一種尺度的檢測結(jié)果可帽。相比輸入圖像，這里用于檢測的特征圖有 32 倍的下采樣窗怒。比如輸入是 416 * 416 的話映跟，這里的特征圖就是 13 * 13 了。由于下采樣倍數(shù)高扬虚，這里特征圖的感受野比較大努隙，因此適合檢測圖像中尺寸比較大的對象。

??為了實現(xiàn)細(xì)粒度的檢測辜昵，第 79 層的特征圖又開始作上采樣（從 79 層往右開始上采樣卷積）荸镊，然后與第 61 層特征圖融合（Concatenation），這樣得到第 91 層較細(xì)粒度的特征圖路鹰，同樣經(jīng)過幾個卷積層后得到相對輸入圖像 16 倍下采樣的特征圖。它具有中等尺度的感受野收厨，適合檢測中等尺度的對象晋柱。

??最后，第 91 層特征圖再次上采樣诵叁，并與第 36 層特征圖融合（Concatenation）雁竞，最后得到相對輸入圖像 8 倍下采樣的特征圖。它的感受野最小拧额，適合檢測小尺寸的對象碑诉。

四、9 種尺度先驗框

隨著輸出的特征圖的數(shù)量和尺度的變化侥锦，先驗框的尺寸也需要相應(yīng)的調(diào)整进栽。YOLO v2 已經(jīng)開始采用 K-means 聚類得到先驗框的尺寸，YOLO v3 延續(xù)了這種方法恭垦，為每種下采樣尺度設(shè)定 3 種先驗框快毛，總共聚類出 9 種尺寸的先驗框格嗅。在 COCO 數(shù)據(jù)集這 9 個先驗框是：(10x13)，(16x30)唠帝，(33x23)屯掖，(30x61)，(62x45)襟衰，(59x119)贴铜，(116x90)，(156x198)瀑晒，(373x326)绍坝。

??分配上，在最小的 13 * 13 特征圖上（有最大的感受野）應(yīng)用較大的先驗框(116x90)瑰妄，(156x198)陷嘴，(373x326)，適合檢測較大的對象间坐。中等的 26 * 26 特征圖上（中等感受野）應(yīng)用中等的先驗框(30x61)灾挨，(62x45)，(59x119)竹宋，適合檢測中等大小的對象劳澄。較大的 52 * 52 特征圖上（較小的感受野）應(yīng)用較小的先驗框(10x13)，(16x30)蜈七，(33x23)秒拔，適合檢測較小的對象。

圖 5：feature map 和先驗框大小的對應(yīng)關(guān)系

我們可以通過下面的圖片來感受一下先驗框的大小和 feature map 大小的關(guān)系飒硅。其中藍(lán)色框為聚類得到的先驗框砂缩。黃色框式 ground truth，紅框是對象中心點(diǎn)所在的網(wǎng)格三娩。

圖 6：9 種先驗框

五庵芭、輸入與輸出

圖 7：網(wǎng)絡(luò)的輸入與輸出

不考慮神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)細(xì)節(jié)的話，總的來說雀监，對于一個輸入圖像双吆，YOLO v3 將其映射到 3 個尺度的輸出張量，代表圖像各個位置存在各種對象的概率会前。

??我們看一下 YOLO v3 共進(jìn)行了多少個預(yù)測好乐。對于一個 416 * 416 的輸入圖像，在每個尺度的特征圖的每個網(wǎng)格設(shè)置 3 個先驗框瓦宜，總共有 13 * 13 * 3 + 26 * 26 * 3 + 52 * 52 * 3 = 10647 個預(yù)測蔚万。每一個預(yù)測是一個 (4 + 1 + 80) = 85 維向量，這個 85 維向量包含邊框坐標(biāo)（4 個數(shù)值）临庇，邊框置信度（1 個數(shù)值）笛坦，對象類別的概率（對于 COCO 數(shù)據(jù)集区转，有 80 種對象）。

??對比一下版扩，YOLO v2 采用 13 * 13 * 5 = 845 個預(yù)測废离，YOLO v3 的嘗試預(yù)測邊框數(shù)量增加了 10 多倍，而且是在不同分辨率上進(jìn)行礁芦，所以 mAP 以及對小物體的檢測效果有一定的提升蜻韭。

六、檢測效果

如果采用 COCO mAP-50 做評估指標(biāo)（不是太介意預(yù)測框的準(zhǔn)確性的話）柿扣，YOLO v3 的表現(xiàn)相當(dāng)驚人肖方，如下圖所示，在精確度相當(dāng)?shù)那闆r下未状，YOLO v3 的速度是其它模型的 3俯画、4 倍。

不過如果要求更精準(zhǔn)的預(yù)測邊框司草，采用 COCO AP 做評估標(biāo)準(zhǔn)的話艰垂，YOLO v3 在精確率上的表現(xiàn)就弱了一些。如下圖所示埋虹。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末猜憎，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子搔课，更是在濱河造成了極大的恐慌胰柑，老刑警劉巖，帶你破解...
沈念sama閱讀 218,755評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件爬泥，死亡現(xiàn)場離奇詭異柬讨，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)袍啡，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,305評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門踩官，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人葬馋，你說我怎么就攤上這事卖鲤∩鋈牛” “怎么了畴嘶？”我有些...
開封第一講書人閱讀 165,138評論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長集晚。經(jīng)常有香客問我窗悯，道長，這世上最難降的妖魔是什么偷拔？我笑而不...
開封第一講書人閱讀 58,791評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任蒋院，我火速辦了婚禮亏钩，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘欺旧。我一直安慰自己姑丑，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,794評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布辞友。她就那樣靜靜地躺著栅哀，像睡著了一般。火紅的嫁衣襯著肌膚如雪称龙。梳的紋絲不亂的頭發(fā)上留拾，一...
開封第一講書人閱讀 51,631評論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音鲫尊，去河邊找鬼痴柔。笑死，一個胖子當(dāng)著我的面吹牛疫向，可吹牛的內(nèi)容都是我干的咳蔚。我是一名探鬼主播，決...
沈念sama閱讀 40,362評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼鸿捧，長吁一口氣：“原來是場噩夢啊……” “哼屹篓！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起匙奴，我...
開封第一講書人閱讀 39,264評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤堆巧，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后泼菌，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體谍肤，經(jīng)...
沈念sama閱讀 45,724評論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,900評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年哗伯，在試婚紗的時候發(fā)現(xiàn)自己被綠了荒揣。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,040評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡焊刹，死狀恐怖系任，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情虐块，我是刑警寧澤俩滥，帶...
沈念sama閱讀 35,742評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站贺奠，受9級特大地震影響霜旧，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜儡率，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,364評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一挂据、第九天我趴在偏房一處隱蔽的房頂上張望以清。院中可真熱鬧，春花似錦崎逃、人聲如沸掷倔。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,944評論 0贊 22
一樁弒父案个绍，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽今魔。三九已至，卻和暖如春障贸，著一層夾襖步出監(jiān)牢的瞬間错森，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,060評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工篮洁，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留涩维，地道東北人。一個月前我還...
沈念sama閱讀 48,247評論 3贊 371
代替公主和親
正文我出身青樓袁波，卻偏偏與公主長得像瓦阐，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子篷牌，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,979評論 2贊 355

Yolo V3詳解

推薦閱讀更多精彩內(nèi)容