Keras實(shí)現(xiàn)基于MSCNN的人群計(jì)數(shù)

對(duì)圖片中的物體進(jìn)行計(jì)數(shù)是一個(gè)非常常見(jiàn)的場(chǎng)景榨呆，尤其是對(duì)人群或者車(chē)輛計(jì)數(shù)凡纳，通過(guò)計(jì)數(shù)我們可以獲得當(dāng)前環(huán)境的流量與擁擠狀況÷伎希現(xiàn)有的人群計(jì)數(shù)方法通称流ⅲ可以分為兩類(lèi)：基于檢測(cè)的方法和基于回歸的方法溉仑⊥诤基于目標(biāo)檢測(cè)的方法在密集的小目標(biāo)上效果并不理想，因此很多研究采用了基于像素回歸的方法進(jìn)行計(jì)數(shù)浊竟。本文實(shí)現(xiàn)了一個(gè)基于Keras的MSCNN人群計(jì)數(shù)模型挪圾。

github：https://github.com/xiaochus/MSCNN
paper：Multi-scale convolutional neural network for crowd counting

環(huán)境

Python 3.6
Keras 2.2.2
Tensorflow-gpu 1.8.0
OpenCV 3.4

數(shù)據(jù)

實(shí)驗(yàn)數(shù)據(jù)采用Mall Dataset crowd counting dataset，該數(shù)據(jù)庫(kù)包括jpeg格式的視頻幀逐沙，地面實(shí)況哲思，透視標(biāo)準(zhǔn)化特征和透視標(biāo)準(zhǔn)化圖，如下所示：

shopping_mall_annotated

shopping_mall_perspective

數(shù)據(jù)處理的代碼如下所示：
1.首先根據(jù)標(biāo)注文件讀入圖像和標(biāo)注吩案。
2.根據(jù)網(wǎng)絡(luò)輸入輸出大小處理標(biāo)注文件棚赔。
3.將人群位置映射為密度圖，其中密度圖使用了高斯濾波處理徘郭。

def read_annotations():
    """read annotation data.

    Returns:
        count: ndarray, head count.
        position: ndarray, coordinate.
    """
    data = sio.loadmat('data\\mall_dataset\\mall_gt.mat')
    count = data['count']
    position = data['frame'][0]

    return count, position


def map_pixels(img, image_key, annotations, size):
    """map annotations to density map.

    Arguments:
        img: ndarray, img.
        image_key: int, image_key.
        annotations: ndarray, annotations.
        size: resize size.

    Returns:
        pixels: ndarray, density map.
    """
    gaussian_kernel = 15
    h, w = img.shape[:-1]
    sh, sw = size / h, size / w
    pixels = np.zeros((size, size))

    for a in annotations[image_key][0][0][0]:
        x, y = int(a[0] * sw), int(a[1] * sh)
        if y >= size or x >= size:
            print("{},{} is out of range, skipping annotation for {}".format(x, y, image_key))
        else:
            pixels[y, x] += 1

    pixels = cv2.GaussianBlur(pixels, (gaussian_kernel, gaussian_kernel), 0)

    return pixels


def get_data(i, size, annotations):
    """get data accoding to the image_key.

    Arguments:
        i: int, image_key.
        size: int, input shape of network.
        annotations: ndarray, annotations.

    Returns:
        img: ndarray, img.
        density_map: ndarray, density map.
    """
    name = 'data\\mall_dataset\\frames\\seq_{}.jpg'.format(str(i + 1).zfill(6))
    img = cv2.imread(name)

    density_map = map_pixels(img, i, annotations, size // 4)

    img = cv2.resize(img, (size, size))
    img = img / 255.
    
    density_map = np.expand_dims(density_map, axis=-1)

    return img, density_map

密度圖還要使用高斯濾波處理是因?yàn)樵诳臻g中計(jì)數(shù)時(shí)靠益，每個(gè)人只占一個(gè)像素點(diǎn)導(dǎo)致最終得到的密度分布圖特別稀疏，會(huì)導(dǎo)致模型收斂到全0狀態(tài)残揉。因此通過(guò)高斯處理后胧后，密度圖呈現(xiàn)出熱力圖的形式，一定程度上解決了稀疏問(wèn)題抱环。而且高斯處理后的密度圖壳快，總計(jì)數(shù)是不變的。

處理過(guò)的輸入圖像以及其對(duì)應(yīng)的密度圖如下所示：

density_map

模型

模型的整體如下圖所示镇草，是一個(gè)比較簡(jiǎn)單的端對(duì)端網(wǎng)絡(luò)眶痰。

Multi-scale convolutional neural network for crowd counting

針對(duì)圖像中的目標(biāo)都是小目標(biāo)的問(wèn)題，作者借鑒了Inception模型提出了一個(gè)Multi-Scale Blob (MSB) 結(jié)構(gòu)梯啤，用來(lái)增強(qiáng)特征的多樣性竖伯。

Multi-scale blob with different kernel size

論文中給出的網(wǎng)絡(luò)結(jié)構(gòu)如下所示：

The multi scale CNN architecture

實(shí)現(xiàn)

基于Keras實(shí)現(xiàn)這個(gè)網(wǎng)絡(luò)結(jié)構(gòu)：

# -*- coding: utf-8 -*-

from keras.layers import Input, Conv2D, MaxPooling2D, concatenate, Activation
from keras.layers.normalization import BatchNormalization
from keras.models import Model
from keras.regularizers import l2
from keras.utils.vis_utils import plot_model


def MSB(filters):
    """Multi-Scale Blob.

    Arguments:
        filters: int, filters num.

    Returns:
        f: function, layer func.
    """
    params = {'activation': 'relu', 'padding': 'same',
              'kernel_regularizer': l2(5e-4)}

    def f(x):
        x1 = Conv2D(filters, 9, **params)(x)
        x2 = Conv2D(filters, 7, **params)(x)
        x3 = Conv2D(filters, 5, **params)(x)
        x4 = Conv2D(filters, 3, **params)(x)
        x = concatenate([x1, x2, x3, x4])
        x = BatchNormalization()(x)
        x = Activation('relu')(x)

        return x
    return f


def MSCNN(input_shape):
    """Multi-scale convolutional neural network for crowd counting.

    Arguments:
        input_shape: tuple, image shape with (w, h, c).

    Returns:
        model: Model, keras model.
    """
    inputs = Input(shape=input_shape)

    x = Conv2D(64, 9, activation='relu', padding='same')(inputs)
    x = MSB(4 * 16)(x)
    x = MaxPooling2D()(x)
    x = MSB(4 * 32)(x)
    x = MSB(4 * 32)(x)
    x = MaxPooling2D()(x)
    x = MSB(3 * 64)(x)
    x = MSB(3 * 64)(x)
    x = Conv2D(1000, 1, activation='relu', kernel_regularizer=l2(5e-4))(x)
    x = Conv2D(1, 1, activation='relu')(x)

    model = Model(inputs=inputs, outputs=x)

    return model


if __name__ == '__main__':
    model = MSCNN((224, 224, 3))

    print(model.summary())
    plot_model(model, to_file='images\model.png', show_shapes=True)

實(shí)驗(yàn)

在項(xiàng)目里通過(guò)下列命令訓(xùn)練模型：

python train.py --size 224 --batch 16 --epochs 10

由于目前沒(méi)有足量的計(jì)算資源使用，我們對(duì)模型做了一個(gè)初步訓(xùn)練測(cè)試效果。

下面是測(cè)試集中相同場(chǎng)景的圖片進(jìn)行測(cè)試的結(jié)果七婴，真實(shí)的count是30祟偷，預(yù)測(cè)的count是27，結(jié)果大致接近打厘。而且其人群密度圖也與圖片中的真實(shí)人群分布對(duì)應(yīng)修肠。

res1

下面是隨便找了一張背景和角度都不同的人群圖，可以看出預(yù)測(cè)出現(xiàn)了較大的偏差婚惫。這是因?yàn)橛?xùn)練集較為單一的緣故，想要得到針對(duì)真實(shí)場(chǎng)景的模型魂爪，需要一個(gè)多樣性的訓(xùn)練集先舷。

count：24

res2

count：31

res3

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市滓侍，隨后出現(xiàn)的幾起案子蒋川，更是在濱河造成了極大的恐慌，老刑警劉巖撩笆，帶你破解...
沈念sama閱讀 217,734評(píng)論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件捺球，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡夕冲，警方通過(guò)查閱死者的電腦和手機(jī)氮兵，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,931評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)歹鱼，“玉大人泣栈，你說(shuō)我怎么就攤上這事∶忠觯” “怎么了南片？”我有些...
開(kāi)封第一講書(shū)人閱讀 164,133評(píng)論 0贊 354
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)庭敦。經(jīng)常有香客問(wèn)我疼进，道長(zhǎng)，這世上最難降的妖魔是什么秧廉？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,532評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任伞广，我火速辦了婚禮，結(jié)果婚禮上疼电，老公的妹妹穿的比我還像新娘赔癌。我一直安慰自己，他們只是感情好澜沟，可當(dāng)我...
茶點(diǎn)故事閱讀 67,585評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布灾票。她就那樣靜靜地躺著，像睡著了一般茫虽。火紅的嫁衣襯著肌膚如雪刊苍。梳的紋絲不亂的頭發(fā)上既们，一...
開(kāi)封第一講書(shū)人閱讀 51,462評(píng)論 1贊 302
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音正什，去河邊找鬼啥纸。笑死，一個(gè)胖子當(dāng)著我的面吹牛婴氮，可吹牛的內(nèi)容都是我干的斯棒。我是一名探鬼主播，決...
沈念sama閱讀 40,262評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼主经，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼荣暮！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起罩驻，我...
開(kāi)封第一講書(shū)人閱讀 39,153評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤穗酥，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后惠遏，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體砾跃，經(jīng)...
沈念sama閱讀 45,587評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,792評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年节吮，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了抽高。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,919評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡透绩，死狀恐怖厨内，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情渺贤，我是刑警寧澤雏胃，帶...
沈念sama閱讀 35,635評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站志鞍，受9級(jí)特大地震影響瞭亮，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜固棚，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,237評(píng)論 3贊 329
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一统翩、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧此洲，春花似錦厂汗、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,855評(píng)論 0贊 22
一樁弒父案娶桦，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至，卻和暖如春衷畦，著一層夾襖步出監(jiān)牢的瞬間栗涂，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,983評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工祈争，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留斤程，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,048評(píng)論 3贊 370
代替公主和親
正文我出身青樓菩混，卻偏偏與公主長(zhǎng)得像忿墅，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子沮峡，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,864評(píng)論 2贊 354

Keras實(shí)現(xiàn)基于MSCNN的人群計(jì)數(shù)

環(huán)境

數(shù)據(jù)

模型

實(shí)現(xiàn)

實(shí)驗(yàn)

推薦閱讀更多精彩內(nèi)容