計算機視覺之語義分割

姓名:劉一婷蘑险;學(xué)號:20021210599;學(xué)院:電子工程學(xué)院

轉(zhuǎn)載于 :https://blog.geohey.com/ji-suan-ji-shi-jue-zhi-yu-yi-fen-ge/

【嵌牛導(dǎo)讀】隨著機器學(xué)習(xí)的發(fā)展鬓催,對計算機的理解能力要求也慢慢提高,語義分割實現(xiàn)了計算機對物體真正含義的學(xué)習(xí)和理解单匣,那么語義分割究竟是什么呢矮冬?

【嵌牛鼻子】語義分割

【嵌牛提問】語義分割的方法稠茂?

【嵌牛正文】

人工智能被認為是第四次工業(yè)革命柠偶,google,facebook等全球頂尖睬关、最有影響力的技術(shù)公司都將目光轉(zhuǎn)向AI诱担,雖然免不了存在泡沫,被部分媒體夸大宣傳电爹,神經(jīng)網(wǎng)絡(luò)在圖像識別蔫仙,語音識別,自然語言處理丐箩,無人車等方面的貢獻是毋庸置疑的摇邦,隨著算法的不斷完善,部分垂直領(lǐng)域的研究已經(jīng)落地應(yīng)用屎勘。

在計算機視覺領(lǐng)域施籍,目前神經(jīng)網(wǎng)絡(luò)的應(yīng)用主要有圖像識別,目標(biāo)定位與檢測概漱,語義分割丑慎。圖像識別就是告訴你圖像是什么,目標(biāo)定位與檢測告訴你圖像中目標(biāo)在哪里,語義分割則是從像素級別回答上面兩個問題竿裂。因為項目需要對衛(wèi)星遙感影像中的小麥和玉米進行語義分割玉吁,這幾天在做相關(guān)方向的研究,下面給大家簡單介紹下語義分割的相關(guān)知識铛绰。

語義分割是什么

圖像語義分割(semantic segmentation)诈茧,從字面意思上理解就是讓計算機根據(jù)圖像的語義來進行分割,例如讓計算機在輸入下面左圖的情況下捂掰,能夠輸出右圖。語義在語音識別中指的是語音的意思曾沈,在圖像領(lǐng)域这嚣,語義指的是圖像的內(nèi)容,對圖片意思的理解塞俱,比如左圖的語義就是三個人騎著三輛自行車姐帚;分割的意思是從像素的角度分割出圖片中的不同對象,對原圖中的每個像素都進行標(biāo)注障涯,比如右圖中粉紅色代表人罐旗,綠色代表自行車。

語義分割當(dāng)前應(yīng)用

目前語義分割的應(yīng)用領(lǐng)域主要有:

地理信息系統(tǒng)

無人車駕駛

醫(yī)療影像分析

機器人等領(lǐng)域

地理信息系統(tǒng):可以通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)讓機器輸入衛(wèi)星遙感影像唯蝶,自動識別道路九秀,河流,莊稼粘我,建筑物等鼓蜒,并且對圖像中每個像素進行標(biāo)注。(下圖左邊為衛(wèi)星遙感影像征字,中間為真實的標(biāo)簽都弹,右邊為神經(jīng)網(wǎng)絡(luò)預(yù)測的標(biāo)簽結(jié)果,可以看到匙姜,隨著訓(xùn)練加深畅厢,預(yù)測準(zhǔn)確率不斷提升。使用ResNet FCN網(wǎng)絡(luò)進行訓(xùn)練)

無人車駕駛:語義分割也是無人車駕駛的核心算法技術(shù)氮昧,車載攝像頭框杜,或者激光雷達探查到圖像后輸入到神經(jīng)網(wǎng)絡(luò)中,后臺計算機可以自動將圖像分割歸類郭计,以避讓行人和車輛等障礙霸琴。

醫(yī)療影像分析:隨著人工智能的崛起,將神經(jīng)網(wǎng)絡(luò)與醫(yī)療診斷結(jié)合也成為研究熱點昭伸,智能醫(yī)療研究逐漸成熟梧乘。在智能醫(yī)療領(lǐng)域,語義分割主要應(yīng)用有腫瘤圖像分割,齲齒診斷等选调。(下圖分別是齲齒診斷夹供,頭部CT掃描緊急護理診斷輔助和肺癌診斷輔助)

語義分割數(shù)據(jù)集

在“數(shù)據(jù),算法仁堪,計算力”這AI發(fā)展的三大驅(qū)動力中哮洽,眼下最重要的就是數(shù)據(jù),數(shù)據(jù)集在人工智能中有著舉足輕重的地位弦聂,具體根據(jù)不同的應(yīng)用領(lǐng)域鸟辅,目前的數(shù)據(jù)集主要有:

Pascal VOC系列:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/通常采用PASCAL VOC 2012,最開始有1464 張具有標(biāo)注信息的訓(xùn)練圖片莺葫,2014 年增加到10582張訓(xùn)練圖片匪凉。主要涉及了日常生活中常見的物體,包括汽車捺檬,狗再层,船等20個分類。

Microsoft COCO:http://link.zhihu.com/?target=http%3A//mscoco.org/explore/一共有80個類別堡纬。這個數(shù)據(jù)集主要用于實例級別的分割(Instance-level Segmentation)以及圖片描述Image Caption)聂受。

Cityscapes:?https://www.cityscapes-dataset.com/?適用于汽車自動駕駛的訓(xùn)練數(shù)據(jù)集椭符,包括19種都市街道場景:road颂龙、side-walk刻诊、building幽钢、wal渣叛、fence蜡吧、pole峦失、traficlight坯沪、trafic sign悴灵、vegetation扛芽、terain、sky积瞒、person川尖、rider、car茫孔、truck叮喳、bus、train缰贝、motorcycle 和 bicycle馍悟。該數(shù)據(jù)庫中用于訓(xùn)練和校驗的精細標(biāo)注的圖片數(shù)量為3475,同時也包含了 2 萬張粗糙的標(biāo)記圖片剩晴。

語義分割中的深度學(xué)習(xí)技術(shù)

全卷積神經(jīng)網(wǎng)絡(luò) FCN(2015)

論文:Fully Convolutional Networks for Semantic SegmentationFCN 所追求的是锣咒,輸入是一張圖片是侵状,輸出也是一張圖片,學(xué)習(xí)像素到像素的映射毅整,端到端的映射趣兄,網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示:

全卷積神經(jīng)網(wǎng)絡(luò)主要使用了三種技術(shù):

卷積化(Convolutional)

上采樣(Upsample)

跳躍結(jié)構(gòu)(Skip Layer)

卷積化(Convolutional)

卷積化即是將普通的分類網(wǎng)絡(luò),比如VGG16悼嫉,ResNet50/101等網(wǎng)絡(luò)丟棄全連接層艇潭,換上對應(yīng)的卷積層即可。

上采樣(Upsample)

有的說叫conv_transpose更為合適戏蔑。因為普通的池化會縮小圖片的尺寸蹋凝,比如VGG16 五次池化后圖片被縮小了32倍。為了得到和原圖等大的分割圖辛臊,我們需要上采樣/反卷積仙粱。反卷積和卷積類似,都是相乘相加的運算彻舰。只不過后者是多對一,前者是一對多候味。而反卷積的前向和后向傳播刃唤,只用顛倒卷積的前后向傳播即可。圖解如下:

跳躍結(jié)構(gòu)(Skip Layer)

這個結(jié)構(gòu)的作用就在于優(yōu)化結(jié)果白群,因為如果將全卷積之后的結(jié)果直接上采樣得到的結(jié)果是很粗糙的尚胞,所以作者將不同池化層的結(jié)果進行上采樣之后來優(yōu)化輸出。具體結(jié)構(gòu)如下:

而不同上采樣結(jié)構(gòu)得到的結(jié)果對比如下:

這是第一種結(jié)構(gòu)帜慢,也是深度學(xué)習(xí)應(yīng)用于圖像語義分割的開山之作笼裳,獲得了CVPR2015的最佳論文。但還是無法避免有很多問題粱玲,比如躬柬,精度問題,對細節(jié)不敏感抽减,以及像素與像素之間的關(guān)系允青,忽略空間的一致性等,后面的研究極大的改善了這些問題卵沉。

SegNet(2015)

論文:A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

主要貢獻:將最大池化指數(shù)轉(zhuǎn)移至解碼器中颠锉,改善了分割分辨率。

空洞卷積(2015)

論文:Multi-Scale Context Aggregation by Dilated Convolutions

主要貢獻:使用了空洞卷積史汗,這是一種可用于密集預(yù)測的卷積層琼掠;提出在多尺度聚集條件下使用空洞卷積的“背景模塊”。

DeepLab(2016)

論文:DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

主要貢獻:使用了空洞卷積停撞;提出了在空間維度上實現(xiàn)金字塔型的空洞池化atrous spatial pyramid pooling(ASPP)瓷蛙;使用了全連接條件隨機場。

參考:

https://www.azavea.com/blog/2017/05/30/deep-learning-on-aerial-imagery/

2.https://zhuanlan.zhihu.com/p/22308032

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市速挑,隨后出現(xiàn)的幾起案子谤牡,更是在濱河造成了極大的恐慌,老刑警劉巖姥宝,帶你破解...
    沈念sama閱讀 216,692評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件翅萤,死亡現(xiàn)場離奇詭異,居然都是意外死亡腊满,警方通過查閱死者的電腦和手機套么,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,482評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來碳蛋,“玉大人胚泌,你說我怎么就攤上這事∷嗟埽” “怎么了玷室?”我有些...
    開封第一講書人閱讀 162,995評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長笤受。 經(jīng)常有香客問我穷缤,道長,這世上最難降的妖魔是什么箩兽? 我笑而不...
    開封第一講書人閱讀 58,223評論 1 292
  • 正文 為了忘掉前任津肛,我火速辦了婚禮,結(jié)果婚禮上汗贫,老公的妹妹穿的比我還像新娘身坐。我一直安慰自己,他們只是感情好落包,可當(dāng)我...
    茶點故事閱讀 67,245評論 6 388
  • 文/花漫 我一把揭開白布部蛇。 她就那樣靜靜地躺著,像睡著了一般妥色。 火紅的嫁衣襯著肌膚如雪搪花。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,208評論 1 299
  • 那天嘹害,我揣著相機與錄音撮竿,去河邊找鬼。 笑死笔呀,一個胖子當(dāng)著我的面吹牛幢踏,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播许师,決...
    沈念sama閱讀 40,091評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼房蝉,長吁一口氣:“原來是場噩夢啊……” “哼僚匆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起搭幻,我...
    開封第一講書人閱讀 38,929評論 0 274
  • 序言:老撾萬榮一對情侶失蹤咧擂,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后檀蹋,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體松申,經(jīng)...
    沈念sama閱讀 45,346評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,570評論 2 333
  • 正文 我和宋清朗相戀三年俯逾,在試婚紗的時候發(fā)現(xiàn)自己被綠了贸桶。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,739評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡桌肴,死狀恐怖皇筛,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情坠七,我是刑警寧澤水醋,帶...
    沈念sama閱讀 35,437評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站彪置,受9級特大地震影響离例,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜悉稠,卻給世界環(huán)境...
    茶點故事閱讀 41,037評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望艘包。 院中可真熱鬧的猛,春花似錦、人聲如沸想虎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,677評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽舌厨。三九已至岂却,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間裙椭,已是汗流浹背躏哩。 一陣腳步聲響...
    開封第一講書人閱讀 32,833評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留揉燃,地道東北人扫尺。 一個月前我還...
    沈念sama閱讀 47,760評論 2 369
  • 正文 我出身青樓,卻偏偏與公主長得像炊汤,于是被迫代替她去往敵國和親正驻。 傳聞我的和親對象是個殘疾皇子弊攘,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,647評論 2 354

推薦閱讀更多精彩內(nèi)容