CrowdNet: A Deep Convolutional Network for Dense Crowd Counting閱讀筆記

Boominathan L , Kruthiventi S S S , Babu R V . CrowdNet: A Deep Convolutional Network for Dense Crowd Counting[J]. 2016.

貢獻(xiàn):

????使用深度和淺度哪轿,完全卷積網(wǎng)絡(luò)deep and shallow, fully convolutional networks的組合來預(yù)測(cè)給定靜態(tài)人群圖像的密度圖伦意。這種組合用于有效地捕獲高級(jí)語義信息high-level semantic information(面部/身體檢測(cè)器)和低級(jí)特征low-level features(斑點(diǎn)檢測(cè)器),這是大規(guī)模變化下人群計(jì)數(shù)所必需的。
????由于大多數(shù)人群數(shù)據(jù)集具有有限的訓(xùn)練樣本(<100圖像)车柠,并且基于深度學(xué)習(xí)的方法需要大量訓(xùn)練數(shù)據(jù)立砸,因此我們執(zhí)行多尺度數(shù)據(jù)增強(qiáng)multi-scale data augmentation洞坑。以這種方式增加訓(xùn)練樣本有助于指導(dǎo)CNN學(xué)習(xí)尺度不變表示缠局。

具體實(shí)現(xiàn):

????攝像機(jī)附近的人通常被捕獲在很大程度上的細(xì)節(jié),即他們的臉部以及有時(shí)他們的整個(gè)身體被捕獲妈拌。然而拥坛,在人們遠(yuǎn)離相機(jī)或從空中視點(diǎn)捕獲圖像的情況下,每個(gè)人僅被表示為頭部斑點(diǎn)head blob尘分。在這兩種情況下對(duì)人的有效檢測(cè)要求模型在高度語義水平(面部/身體檢測(cè)器)同時(shí)操作猜惋,同時(shí)還識(shí)別低級(jí)別的頭部模式。我們的模型使用深度和淺層卷積神經(jīng)網(wǎng)絡(luò)的組合來實(shí)現(xiàn)這一點(diǎn)培愁。

深層網(wǎng)絡(luò):

????在深層網(wǎng)絡(luò)中著摔,類比了VGG的結(jié)構(gòu):VGG網(wǎng)絡(luò)有5個(gè)max-pool層,每個(gè)層的步幅為2定续,因此得到的輸出特征的空間分辨率僅為輸入圖像的1/32倍谍咆。
????在我們對(duì)VGG模型的改編中,我們將第四個(gè)max-pool層的步幅設(shè)置為1私股,并完全刪除第5個(gè)max-pool層摹察。 這使網(wǎng)絡(luò)能夠以輸入分辨率的1/8進(jìn)行預(yù)測(cè)。 我們使用膨脹卷積處理第四個(gè)最大池層中步幅的移除引起的感受野不匹配倡鲸。

淺層網(wǎng)絡(luò):

????在我們的模型中供嚎,我們的目標(biāo)是使用淺卷積網(wǎng)絡(luò)識(shí)別從遠(yuǎn)離相機(jī)的人身上產(chǎn)生的低水平頭部斑點(diǎn)圖案。由于斑點(diǎn)檢測(cè)不需要捕獲高級(jí)語義峭状,因此我們將該網(wǎng)絡(luò)設(shè)計(jì)為僅具有3個(gè)卷積層的淺層克滴。每一層都有24個(gè)過濾器,內(nèi)核大小為5X5优床。為了使該網(wǎng)絡(luò)的預(yù)測(cè)空間分辨率等于其深部對(duì)應(yīng)的預(yù)測(cè)空間分辨率劝赔,我們?cè)诿總€(gè)卷積層之后使用池層。我們的淺網(wǎng)絡(luò)主要用于探測(cè)小的頭部斑點(diǎn)胆敞。為了確保不因最大池而丟失計(jì)數(shù)望忆,我們?cè)跍\網(wǎng)絡(luò)中使用平均池層罩阵。
????我們連接深層和淺層網(wǎng)絡(luò)的預(yù)測(cè),每個(gè)網(wǎng)絡(luò)的空間分辨率是輸入圖像的1/8启摄,并使用1x1卷積層進(jìn)行處理。 使用雙線性插值bilinear interpolation將該層的輸出上采樣upsample到輸入圖像的大小幽钢,以獲得最終的人群密度預(yù)測(cè)歉备。 可以通過對(duì)預(yù)測(cè)密度圖的求和來獲得圖像中人的總數(shù)。 通過反向傳播相對(duì)于地面實(shí)況計(jì)算的L2損失來訓(xùn)練網(wǎng)絡(luò)匪燕。

標(biāo)注方法:

????通過使用歸一化為和的高斯核模糊每個(gè)頭部注釋來生成基本事實(shí)蕾羊。這種模糊導(dǎo)致密度圖的總和與人群中的總?cè)藬?shù)相同。以這樣一種方式準(zhǔn)備基本事實(shí)使CNN更容易了解基本事實(shí)帽驯,因?yàn)镃NN不再需要準(zhǔn)確的頭部注釋龟再。它還提供了有關(guān)哪些區(qū)域?qū)τ?jì)數(shù)有貢獻(xiàn)以及貢獻(xiàn)多少的信息。這有助于培訓(xùn)CNN正確預(yù)測(cè)人群密度和人數(shù)尼变。

數(shù)據(jù)擴(kuò)充:

????由于CNN需要大量的訓(xùn)練數(shù)據(jù)利凑,因此我們對(duì)我們的訓(xùn)練數(shù)據(jù)集進(jìn)行了廣泛的擴(kuò)充。我們主要執(zhí)行兩種增強(qiáng)嫌术。第一種類型的增強(qiáng)有助于解決人群圖像中的尺度變化問題哀澈,而第二種類型提高了CNN在極易出錯(cuò)的區(qū)域(即高度密集的人群區(qū)域)的表現(xiàn)
????一:為了使CNN對(duì)尺度變化具有魯棒性robust度气,我們從每個(gè)訓(xùn)練圖像的多尺度金字塔表示中裁剪patches 割按。我們考慮0.5到1.2的比例,以步驟0.1為單位磷籍,乘以原始圖像分辨率(如圖3所示)來構(gòu)建圖像金字塔image pyramid适荣。我們從這個(gè)金字塔形表示中裁剪出225X225個(gè)patches ,重疊率為50%overlap院领。通過這種增強(qiáng)弛矛,CNN可以識(shí)別不同規(guī)模的人。
????二:我們觀察到CNN和高度密集的人群本身難以處理栅盲。為了克服這個(gè)問題汪诉,我們通過更頻繁地采樣高密度patch來增加訓(xùn)練數(shù)據(jù)。

實(shí)驗(yàn)結(jié)果:

????使用5折交叉驗(yàn)證5-fold cross validation來評(píng)估方法的性能谈秫。我們將數(shù)據(jù)集隨機(jī)分成五塊split扒寄,每塊包含10個(gè)圖像。在交叉驗(yàn)證的每個(gè)折疊中拟烫,我們考慮用于訓(xùn)練網(wǎng)絡(luò)的四個(gè)塊(40個(gè)圖像)和用于對(duì)其性能進(jìn)行驗(yàn)證的剩余塊(10個(gè)圖像)该编。我們按照先前描述的數(shù)據(jù)增強(qiáng)方法從40個(gè)訓(xùn)練圖像中的每一個(gè)中采樣225X225個(gè)補(bǔ)丁。該程序每次平均產(chǎn)生50,292個(gè)訓(xùn)練補(bǔ)丁硕淑。我們的網(wǎng)絡(luò)使用隨機(jī)梯度下降SGD優(yōu)化進(jìn)行訓(xùn)練课竣,學(xué)習(xí)率為1e-7嘉赎。
????使用平均絕對(duì)誤差(MAE)來量化我們方法的性能。MAE計(jì)算數(shù)據(jù)集中所有圖像的實(shí)際計(jì)數(shù)和預(yù)測(cè)計(jì)數(shù)之間的絕對(duì)差異的平均值于樟。


?

論文地址:https://arxiv.org/pdf/1608.06197v1.pdf
源碼:github地址:deep-crowd-counting_crowdnet

?

可參考:

1公条、人群密度估計(jì)之CrowdNet
這種網(wǎng)絡(luò)的訓(xùn)練一般有3種方法:1,自己擼一個(gè)data數(shù)據(jù)層迂曲。在caffe源碼中實(shí)現(xiàn)原始圖片和密度圖向blob的傳遞靶橱。可以參考在caffe 中添加Crowd counting 數(shù)據(jù)層
2路捧,自己使用matlab生成密度圖关霸,做成LMDB,輸入的時(shí)候杰扫,分別讀取data和label队寇,這里需要注意,絕對(duì)不要使用shuffle章姓,因?yàn)閐ata和label需要一一對(duì)應(yīng)
3佳遣,還是自己生成密度圖,然后做成hdf5啤覆,這個(gè)好處就是支持double類型的密度圖苍日,感覺精度會(huì)更好點(diǎn)。

2窗声、人群密度估計(jì)--CrowdNet: A Deep Convolutional Network for Dense Crowd Counting

3相恃、人群密度估計(jì)-Crowd Density
論文采用了兩個(gè)網(wǎng)絡(luò)的融合,可以理解為不同的網(wǎng)絡(luò)提取的特征不同笨觅,上面 Max Pool 對(duì)邊緣特征(細(xì)節(jié))提取較好拦耐,下面的 Shallow Net 采用 Avrg Pool 對(duì)于整體特征描述較好,兩個(gè)網(wǎng)絡(luò)通過一個(gè) concat 進(jìn)行連接见剩,然后1*1的conv進(jìn)行降維杀糯,非常簡(jiǎn)單。
這里面有兩個(gè)細(xì)節(jié)要注意:
1)文中采用了膨脹卷積苍苞,提取整體特征固翰,這個(gè)現(xiàn)在用的也比較多了,估計(jì)都很熟羹呵;
2)數(shù)據(jù)增廣骂际,采用了不同尺度的樣本采樣,Hard mining策略冈欢,也都是老套路了歉铝;

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市凑耻,隨后出現(xiàn)的幾起案子太示,更是在濱河造成了極大的恐慌柠贤,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,544評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件类缤,死亡現(xiàn)場(chǎng)離奇詭異臼勉,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)呀非,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門坚俗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人岸裙,你說我怎么就攤上這事∷倮拢” “怎么了降允?”我有些...
    開封第一講書人閱讀 162,764評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)艺糜。 經(jīng)常有香客問我剧董,道長(zhǎng),這世上最難降的妖魔是什么破停? 我笑而不...
    開封第一講書人閱讀 58,193評(píng)論 1 292
  • 正文 為了忘掉前任翅楼,我火速辦了婚禮,結(jié)果婚禮上真慢,老公的妹妹穿的比我還像新娘毅臊。我一直安慰自己,他們只是感情好黑界,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,216評(píng)論 6 388
  • 文/花漫 我一把揭開白布管嬉。 她就那樣靜靜地躺著,像睡著了一般朗鸠。 火紅的嫁衣襯著肌膚如雪蚯撩。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,182評(píng)論 1 299
  • 那天烛占,我揣著相機(jī)與錄音胎挎,去河邊找鬼。 笑死忆家,一個(gè)胖子當(dāng)著我的面吹牛犹菇,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播弦赖,決...
    沈念sama閱讀 40,063評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼项栏,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了蹬竖?” 一聲冷哼從身側(cè)響起沼沈,我...
    開封第一講書人閱讀 38,917評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤流酬,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后列另,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體芽腾,經(jīng)...
    沈念sama閱讀 45,329評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,543評(píng)論 2 332
  • 正文 我和宋清朗相戀三年页衙,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了摊滔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,722評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡店乐,死狀恐怖艰躺,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情眨八,我是刑警寧澤腺兴,帶...
    沈念sama閱讀 35,425評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站廉侧,受9級(jí)特大地震影響页响,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜段誊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,019評(píng)論 3 326
  • 文/蒙蒙 一闰蚕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧连舍,春花似錦没陡、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,671評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至参滴,卻和暖如春强岸,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背砾赔。 一陣腳步聲響...
    開封第一講書人閱讀 32,825評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工蝌箍, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人暴心。 一個(gè)月前我還...
    沈念sama閱讀 47,729評(píng)論 2 368
  • 正文 我出身青樓妓盲,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親专普。 傳聞我的和親對(duì)象是個(gè)殘疾皇子悯衬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,614評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容