自動(dòng)駕駛?cè)腴T日記-6-視頻語義分割

在自動(dòng)駕駛?cè)蝿?wù)中复颈,實(shí)時(shí)性一直是急需解決的一個(gè)問題,也是極其具有挑戰(zhàn)性的一個(gè)問題沥割。一方面耗啦,現(xiàn)階段一輛裝滿所有傳感器的自動(dòng)駕駛汽車每秒收集的數(shù)據(jù)量高達(dá)1-4GB(數(shù)據(jù)來自網(wǎng)絡(luò),不一定準(zhǔn)確)机杜,另一方面帜讲,為保證汽車長時(shí)間的續(xù)航能力,自動(dòng)駕駛汽車應(yīng)盡可能的保證節(jié)省電力椒拗,同時(shí)大功率的計(jì)算部件其散熱也是一個(gè)必須解決的問題似将。

因此,如何在減少計(jì)算量的同時(shí)保證得到的結(jié)果準(zhǔn)確魯棒就是計(jì)算機(jī)視覺科學(xué)家應(yīng)該審慎思考的一個(gè)問題了蚀苛,目前針對降低自動(dòng)駕駛視頻語義分割延遲的相關(guān)工作已經(jīng)發(fā)表了很多在验,我選取其中的幾篇進(jìn)行簡答介紹。

1.SegNet: A Deep Convolutional Encoder-Decoder Architecture for Robust Semantic Pixel-Wise Labelling

參考資料:卷積神經(jīng)網(wǎng)絡(luò)CNN(4)—— SegNet

SegNet使劍橋大學(xué)機(jī)器智能實(shí)驗(yàn)室提出的在FCN的基礎(chǔ)上修改的一種比較優(yōu)美的網(wǎng)絡(luò)結(jié)構(gòu)堵未,由于其官網(wǎng)上提供了很詳盡的學(xué)習(xí)資料腋舌,因此在其基礎(chǔ)上也衍生出了很多優(yōu)秀工作。


網(wǎng)絡(luò)結(jié)構(gòu)

網(wǎng)絡(luò)結(jié)構(gòu)的細(xì)節(jié)感興趣的可以看論文渗蟹,由于篇幅問題這里比詳細(xì)闡述了块饺。SegNet的架構(gòu)可以看作一個(gè)Encoder-Decoder模型,前一半可以看作一個(gè)使用CNN和polling的編碼器雌芽,后一部分使用upsampling與deconvolution組成對應(yīng)的解碼器授艰。

值得注意的是,相比于其他網(wǎng)絡(luò)結(jié)構(gòu)的pooling層世落,SegNet中的pooling層多了一個(gè)index的功能淮腾,即記錄最大池化時(shí)所選取的數(shù)值的位置信息,以便在上采樣過程中進(jìn)行恢復(fù)。谷朝、


unpooling

Bayesian SegNet

在SeNet中最后每個(gè)像素都會對每一類的概率進(jìn)行計(jì)算篮灼,再通過Softmax輸出概率最大的一個(gè),然后這個(gè)像素點(diǎn)就認(rèn)為是這一類別徘禁,對應(yīng)的概率就是這一像素屬于該類的概率诅诱。這種由原因到結(jié)果的推導(dǎo),可以稱為先驗(yàn)概率送朱,任何先驗(yàn)概率使用都會出現(xiàn)一個(gè)問題娘荡,不能知道這一結(jié)果的可靠性,即便先驗(yàn)概率非常大驶沼,但是對于不同的樣本炮沐,先驗(yàn)概率無法保證一定正確。正是如此回怜,才需要有從結(jié)果尋找原因的貝葉斯概率大年,即后驗(yàn)概率,它能給出結(jié)果的可信程度玉雾,即置信度翔试。Bayesian SegNet正是通過后驗(yàn)概率,告訴我們圖像語義分割結(jié)果的置信度是多少复旬。


Bayesian SegNet

可見垦缅,在網(wǎng)絡(luò)中加入一層Dropout即可得到語義分割圖像的不確定性灰度圖,具體的原理參考Dropout as a Bayesian approximation: Representing model uncertainty in deep learning驹碍。

高斯過程是指任意有限個(gè)隨機(jī)變量都服從聯(lián)合高斯分布壁涎,同時(shí)只需要知道均值與協(xié)防差就能夠確定一個(gè)高斯過程,所以高斯過程可以用于從有限維到無限維的回歸問題志秃,從已知高斯分布怔球,增加新的隨機(jī)變量分布可以求出新的高斯分布,根據(jù)新的分布可以求出其均值與方差浮还。?

如何確定一個(gè)高斯分布竟坛?需要多次采樣才能確定一個(gè)分布。蒙特卡羅抽樣告訴我們可以通過設(shè)計(jì)一個(gè)試驗(yàn)方法將一個(gè)事件的頻率轉(zhuǎn)化為概率碑定,因?yàn)樵谧銐虼蟮臉颖局辛髀耄录l(fā)生的頻率會趨向事件發(fā)生的概率,因此可以很方便地求出一個(gè)未知分布延刘。通過蒙特卡羅抽樣,就可以求出一個(gè)新分布的均值與方差六敬,這樣使用方差大小就可以知道一個(gè)分布對于樣本的差異性碘赖,方差越大差異越大。

在Bayesian SegNet中通過DropOut層實(shí)現(xiàn)多次采樣,多次采樣的樣本值為最后輸出普泡,方差最為其不確定度播掷,方差越大不確定度越大,多次采樣后就可以得到不確定性的灰度圖撼班。

可以看到歧匈,不確定性灰度圖很像圖像的邊界提取,這也直觀的表明了在語義分割問題中邊界的不確定性較大的問題砰嘁。

2.Low-Latency Video Semantic Segmentation

參考資料:CVPR 2018 | 商湯科技Spotlight論文詳解:極低延遲性的視頻語義分割

算法核心思想

本文算法使用視頻分割中經(jīng)典的基于關(guān)鍵幀調(diào)度的模式來有效平衡計(jì)算量和精度件炉。具體來說,如果當(dāng)前處理幀為關(guān)鍵幀矮湘,則使用整個(gè)分割網(wǎng)絡(luò)來獲得語義分割的標(biāo)簽斟冕,如圖2左部分所示;如果當(dāng)前幀不為關(guān)鍵幀缅阳,則變換分割網(wǎng)絡(luò)高層歷史幀特征為當(dāng)前幀高層特征磕蛇,再使用分割網(wǎng)絡(luò)的語義分類操作獲得當(dāng)前幀的語義標(biāo)簽,如圖2右部分所示十办。關(guān)鍵幀的選擇和特征跨幀傳播兩個(gè)操作均基于同樣的網(wǎng)絡(luò)低層特征秀撇,具體操作在之后章節(jié)詳述。在劃分分割網(wǎng)絡(luò)結(jié)構(gòu)時(shí)向族,算法盡量保證低層網(wǎng)絡(luò)的運(yùn)行時(shí)間遠(yuǎn)小于高層網(wǎng)絡(luò)捌袜,(如圖2所示)低層網(wǎng)絡(luò)耗時(shí)61ms,而高層網(wǎng)絡(luò)耗時(shí)300ms炸枣。這樣考慮的出發(fā)點(diǎn)在于:因低層網(wǎng)絡(luò)的計(jì)算代價(jià)很小虏等,算法可以基于低層網(wǎng)絡(luò)提取的特征,增加少部分額外的計(jì)算來完成關(guān)鍵幀選擇和特征跨幀傳播适肠;當(dāng)前幀的低層特征同樣包含當(dāng)前幀的信息霍衫,可以互補(bǔ)來自不同時(shí)間的傳播特征;所有的操作均復(fù)用了逐幀模型的結(jié)構(gòu)侯养,算法整體模型更加簡潔敦跌。

由于實(shí)現(xiàn)過程中涉及到一種關(guān)鍵幀調(diào)度的問題,而以往的關(guān)鍵幀選取方法要么簡化為固定時(shí)間間隔選取逛揩,要么計(jì)算高層特征差異柠傍,根據(jù)設(shè)定閾值選取。前者無法適應(yīng)視頻幀內(nèi)容變化辩稽,容易錯(cuò)過關(guān)鍵幀或者浪費(fèi)計(jì)算資源惧笛,后者由于特征變化較大,閾值難以確定逞泄。因此作者使用當(dāng)前幀語義標(biāo)簽和前一個(gè)關(guān)鍵幀語義標(biāo)簽的差異值來作為視頻內(nèi)容變化程度的判斷依據(jù)患整,當(dāng)差值超過某個(gè)閾值的時(shí)候拜效,則選擇該幀作為關(guān)鍵幀。但是直接計(jì)算這樣一個(gè)差異值較為困難各谚,作者在Cityscapes和Camvid兩個(gè)數(shù)據(jù)集上發(fā)現(xiàn)低層特征和語義標(biāo)簽的變化值有很大的關(guān)聯(lián)紧憾,因而利用低層特征來預(yù)測這樣該差值,即輸入歷史幀低層特征和當(dāng)前幀低層特征到一個(gè)回歸器來回歸該差異值昌渤。


自適應(yīng)關(guān)鍵幀選擇


整體框架

當(dāng)視頻的序列幀不斷輸入時(shí)赴穗,在第一幀時(shí)刻,進(jìn)行初始化操作膀息,即輸入圖片幀給整個(gè)網(wǎng)絡(luò)般眉,獲得低層特征和高層特征。在接下來的時(shí)刻t進(jìn)行自適應(yīng)的計(jì)算履婉,首先計(jì)算低層特征:輸入和上一個(gè)關(guān)鍵幀低層特征至自適應(yīng)關(guān)鍵幀選擇模塊煤篙,判斷當(dāng)前幀是否為關(guān)鍵幀。若為關(guān)鍵幀毁腿,則輸入底層特征至高層網(wǎng)絡(luò)獲得高層特征辑奈;否則輸入底層特征至自適應(yīng)特征傳播模塊獲得當(dāng)前幀高層特征,進(jìn)而通過語義分類獲得當(dāng)前幀語義標(biāo)簽已烤。

本文在犧牲較小精度的條件下極大的降低了系統(tǒng)延遲鸠窗,這種低延遲調(diào)度策略可將延遲由360ms降低到119ms。但是本文方法在場景變化劇烈的條件下(即關(guān)鍵幀采樣比較密集)仍然無法有效降低延遲胯究,因此論文作者希望在未來工作中在模型壓縮和模型設(shè)計(jì)方面進(jìn)一步降低算法的總體延遲和計(jì)算量稍计。

祝好!愿與諸君一起進(jìn)步裕循。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末臣嚣,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子剥哑,更是在濱河造成了極大的恐慌硅则,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件株婴,死亡現(xiàn)場離奇詭異怎虫,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)困介,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門大审,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人座哩,你說我怎么就攤上這事徒扶。” “怎么了八回?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵酷愧,是天一觀的道長驾诈。 經(jīng)常有香客問我缠诅,道長溶浴,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任管引,我火速辦了婚禮士败,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘褥伴。我一直安慰自己谅将,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布重慢。 她就那樣靜靜地躺著饥臂,像睡著了一般。 火紅的嫁衣襯著肌膚如雪似踱。 梳的紋絲不亂的頭發(fā)上隅熙,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機(jī)與錄音核芽,去河邊找鬼囚戚。 笑死,一個(gè)胖子當(dāng)著我的面吹牛轧简,可吹牛的內(nèi)容都是我干的驰坊。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼哮独,長吁一口氣:“原來是場噩夢啊……” “哼拳芙!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起皮璧,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤舟扎,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后恶导,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體浆竭,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年惨寿,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了邦泄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡裂垦,死狀恐怖顺囊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蕉拢,我是刑警寧澤特碳,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布诚亚,位于F島的核電站,受9級特大地震影響午乓,放射性物質(zhì)發(fā)生泄漏抑淫。R本人自食惡果不足惜癌幕,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧管呵,春花似錦脖隶、人聲如沸侵歇。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽摸袁。三九已至钥顽,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間靠汁,已是汗流浹背蜂大。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留膀曾,地道東北人县爬。 一個(gè)月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像添谊,于是被迫代替她去往敵國和親财喳。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容