交通場(chǎng)景计济、車(chē)道分割算法-SCNN

論文中提出了一個(gè)新穎的網(wǎng)絡(luò)Spatial CNN,該網(wǎng)絡(luò)在圖片的行和列上做信息傳遞排苍,可以有效的識(shí)別強(qiáng)先驗(yàn)結(jié)構(gòu)的目標(biāo)沦寂。同時(shí)論文提出了一個(gè)大型的車(chē)道檢測(cè)數(shù)據(jù)集UCLane,用于進(jìn)一步推動(dòng)自動(dòng)駕駛發(fā)展淘衙。

offical githubhttps://github.com/XingangPan/SCNN
paperSpatial As Deep: Spatial CNN for Traffic Scene Understanding

模型

本文提出的SCNN算法將傳統(tǒng)的卷積層接層(layer-by-layer)的連接形式的轉(zhuǎn)為feature map中片連片卷積(slice-by-slice)的形式传藏,使得圖中像素行和列之間能夠傳遞信息。這特別適用于檢測(cè)長(zhǎng)距離連續(xù)形狀的目標(biāo)或大型目標(biāo),有著極強(qiáng)的空間關(guān)系但是外觀(guān)線(xiàn)索較差的目標(biāo)毯侦,例如交通線(xiàn)西壮,電線(xiàn)桿和墻。

傳統(tǒng)的CNN不能有效處理具有長(zhǎng)距離連續(xù)的形狀(尤其是在遮擋的情況下)叫惊。MRF/CRF+CNN的結(jié)構(gòu)使用一個(gè)大卷積核來(lái)進(jìn)行信息傳遞,但是會(huì)導(dǎo)致計(jì)算效率低下做修,并且大卷積核很難訓(xùn)練霍狰,如下圖(a)所示;而SCNN分別在列方向與行方向使用寬卷積做了循環(huán)的信息傳遞饰及,這樣就增強(qiáng)了空間信息進(jìn)而對(duì)于識(shí)別結(jié)構(gòu)化對(duì)象特別有效蔗坯,如下圖(b)所示。


Model

D燎含、U宾濒、R、L是四個(gè)信息傳遞模塊屏箍。D绘梦、U沿著H方向做了從上到下和從下到上的信息傳遞;R赴魁、L沿著W方向做了從左到右和從右到左的信息傳遞卸奉。信息傳遞的公式如下所示,f是relu函數(shù)颖御,每一個(gè)模塊的卷積函數(shù)都共享同一個(gè)卷積核榄棵。
簡(jiǎn)單的舉一個(gè)例子,假設(shè)x0h方向上的第一片特征潘拱,x1為第二片疹鳄,那么x0x1的信息傳遞過(guò)程就是x1=x1+relu(conv2D(x0)),后面的操作就可以這樣循環(huán)下去芦岂。這個(gè)操作類(lèi)似于循環(huán)的殘差操作瘪弓,既能夠加快計(jì)算效率又能傳遞長(zhǎng)信息。

Message pass equation

在信息傳遞(Message Pass)過(guò)程中盔腔,MRF/CRF中每個(gè)像素點(diǎn)會(huì)直接接收其他所有像素點(diǎn)的信息(大卷積核實(shí)現(xiàn))杠茬,這其中有許多冗余計(jì)算;而SCNN在信息傳遞的時(shí)候并不是獲取全局元素弛随,而是順序傳遞瓢喉,由此簡(jiǎn)化了信息傳遞的結(jié)構(gòu)加快了模型的運(yùn)算效率,如下圖所示:


Message pass

在進(jìn)行車(chē)道檢測(cè)時(shí)舀透,在上述模型的基礎(chǔ)上栓票,在輸出結(jié)果上添加了一個(gè)分支網(wǎng)絡(luò)。這個(gè)分支網(wǎng)絡(luò)能夠直接區(qū)分不同車(chē)道標(biāo)記,這樣魯棒性更好走贪。共有4中類(lèi)型的車(chē)道線(xiàn)佛猛。輸出的概率圖經(jīng)過(guò)這個(gè)分支網(wǎng)絡(luò)預(yù)測(cè)車(chē)道標(biāo)記是否存在。
對(duì)于存在值大于0.5的車(chē)道標(biāo)記,在對(duì)應(yīng)的概率圖每20行搜索以獲得最高的響應(yīng)位置,然后通過(guò)三次樣條函數(shù)連接這些點(diǎn)(cubic splines)郭赐,就得到了最終的預(yù)測(cè)鳞陨。


road lane

這是該算法在車(chē)道分割上達(dá)成的效果,使用了UCLane數(shù)據(jù)庫(kù)

road lane res

這是該算法在交通場(chǎng)景分割上達(dá)成的效果,使用了cityscapes數(shù)據(jù)庫(kù)

traffic sense res

模型實(shí)現(xiàn)

這個(gè)實(shí)現(xiàn)與官方實(shí)現(xiàn)并不是完全一致,僅用來(lái)理解SCNN的網(wǎng)絡(luò)結(jié)構(gòu),同時(shí)由于數(shù)據(jù)集較大也沒(méi)有進(jìn)行訓(xùn)練測(cè)試边臼。想要訓(xùn)練使用這個(gè)模型可以下載官方的torch版本或者tf版本

首先我們將信息傳遞的過(guò)程封裝成一個(gè)keras層假消,每個(gè)MessagePass層沿一個(gè)軸做兩個(gè)方向的信息傳遞柠并,如下所示:

class MessagePass(Layer):
    def __init__(self, output_dim,
                 axis,
                 **kwargs):
        if 'input_shape' not in kwargs and 'input_dim' in kwargs:
            kwargs['input_shape'] = (kwargs.pop('input_dim'),)
        super(MessagePass, self).__init__(**kwargs)

        self.output_dim = output_dim
        self.axis = axis

    def build(self, input_shape):
        assert self.axis in [1, 2]
        assert input_shape[-1] == self.output_dim

        if self.axis == 1:
            kernel_shape = [1, 9, input_shape[-1], self.output_dim]
        if self.axis == 2:
            kernel_shape = [9, 1, input_shape[-1], self.output_dim]

        self.w1 = self.add_weight(name='one', 
                                 shape=kernel_shape,
                                 initializer='glorot_uniform',
                                 trainable=True)
        self.w2 = self.add_weight(name='two', 
                                 shape=kernel_shape,
                                 initializer='glorot_uniform',
                                 trainable=True)

        super(MessagePass, self).build(input_shape)

    def call(self, inputs, **kwargs):
        h, w = int(inputs.shape[1]), int(inputs.shape[2])
        
        if self.axis == 1:
            n = h
        if self.axis == 2:
            n = w

        feature_slice_old = []
        feature_slice_new = []

        for i in range(n):
            if self.axis == 1:
                cur_slice = K.expand_dims(inputs[:, i, :, :], axis=1)
            else:
                cur_slice = K.expand_dims(inputs[:, :, i, :], axis=2)
            feature_slice_old.append(cur_slice)

            if i == 0:
                feature_slice_new.append(cur_slice)
            else:
                tmp = K.relu(K.conv2d(feature_slice_old[i - 1], self.w1, padding='same'))
                tmp = tmp + feature_slice_old[i]
                feature_slice_new.append(tmp)

        feature_slice_old = feature_slice_new
        feature_slice_new = []

        for i in reversed(range(n)):
            if self.axis == 1:
                cur_slice = K.expand_dims(inputs[:, i, :, :], axis=1)
            else:
                cur_slice = K.expand_dims(inputs[:, :, i, :], axis=2)
            feature_slice_old.append(cur_slice)

            if i == (n - 1):
                feature_slice_new.append(cur_slice)
            else:
                tmp = K.relu(K.conv2d(feature_slice_old[i - 1], self.w2, padding='same'))
                tmp = tmp + feature_slice_old[i]
                feature_slice_new.append(tmp)

        output = K.stack(feature_slice_new, axis=self.axis)
        output = K.squeeze(output, axis=self.axis + 1)

        return output

    def compute_output_shape(self, input_shape):
        return (input_shape[0], input_shape[1], input_shape[2], self.output_dim)

我們選擇DenseNet 121作為backbone網(wǎng)絡(luò),選取8倍縮小的那一個(gè)特征圖作為輸出特征富拗,然后為這個(gè)特征接上信息傳遞層臼予,如下所示:

class SCNN:
    def __init__(self, height, width, classes=5):
        self.classes = classes
        self.height = height
        self.width = width

    def backbone(self):
        model = DenseNet121(
                input_shape=(self.height, self.width, 3),
                weights=None, 
                include_top=False)

        out_conv = model.get_layer('pool3_conv').output

        return model.input, out_conv

    def build(self):
        inputs, conv_out = self.backbone()

        conv_out = Conv2D(128, (1, 1), padding='same')(conv_out)
        conv_out = BatchNormalization()(conv_out)
        conv_out = Activation('relu')(conv_out)

        conv_out = MessagePass(128, 1)(conv_out)
        conv_out = MessagePass(128, 2)(conv_out)

        conv_out = Conv2D(self.classes, (1, 1), activation='softmax', padding='same')(conv_out)
        prob_output = UpSampling2D((8, 8))(conv_out)

        # add lane existence prediction branch
        x = AveragePooling2D(strides=2)(conv_out)
        x = Flatten()(x)
        x = Dense(128, activation='relu')(x)
        existence_output = Dense(4, activation='sigmoid')(x)

        model = Model(inputs=inputs, outputs=[prob_output, existence_output])

        opt = SGD(lr=0.01, momentum=0.9, decay=0.0001)
        model.compile(
                optimizer=opt,
                loss=['categorical_crossentropy', 'binary_crossentropy'])

        return model


if __name__ == '__main__':
    model = SCNN(288, 800).build()
    print(model.summary())
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市媒峡,隨后出現(xiàn)的幾起案子瘟栖,更是在濱河造成了極大的恐慌,老刑警劉巖谅阿,帶你破解...
    沈念sama閱讀 217,509評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件半哟,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡签餐,警方通過(guò)查閱死者的電腦和手機(jī)寓涨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)氯檐,“玉大人戒良,你說(shuō)我怎么就攤上這事」谏悖” “怎么了糯崎?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,875評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀(guān)的道長(zhǎng)河泳。 經(jīng)常有香客問(wèn)我沃呢,道長(zhǎng),這世上最難降的妖魔是什么拆挥? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,441評(píng)論 1 293
  • 正文 為了忘掉前任薄霜,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘惰瓜。我一直安慰自己否副,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布崎坊。 她就那樣靜靜地躺著备禀,像睡著了一般。 火紅的嫁衣襯著肌膚如雪奈揍。 梳的紋絲不亂的頭發(fā)上痹届,一...
    開(kāi)封第一講書(shū)人閱讀 51,365評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音打月,去河邊找鬼。 笑死蚕捉,一個(gè)胖子當(dāng)著我的面吹牛奏篙,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播迫淹,決...
    沈念sama閱讀 40,190評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼秘通,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了敛熬?” 一聲冷哼從身側(cè)響起肺稀,我...
    開(kāi)封第一講書(shū)人閱讀 39,062評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎应民,沒(méi)想到半個(gè)月后话原,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,500評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡诲锹,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評(píng)論 3 335
  • 正文 我和宋清朗相戀三年繁仁,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片归园。...
    茶點(diǎn)故事閱讀 39,834評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡黄虱,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出庸诱,到底是詐尸還是另有隱情捻浦,我是刑警寧澤,帶...
    沈念sama閱讀 35,559評(píng)論 5 345
  • 正文 年R本政府宣布桥爽,位于F島的核電站朱灿,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏聚谁。R本人自食惡果不足惜母剥,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧环疼,春花似錦习霹、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,779評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至伪阶,卻和暖如春煞檩,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背栅贴。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,912評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工斟湃, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人檐薯。 一個(gè)月前我還...
    沈念sama閱讀 47,958評(píng)論 2 370
  • 正文 我出身青樓凝赛,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親坛缕。 傳聞我的和親對(duì)象是個(gè)殘疾皇子墓猎,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容