第五天 綜述筆記3 10大類基于深度學(xué)習(xí)的segmentation model(下)

第六類:空洞卷積和DeepLab系列

空洞卷積髓考,為卷積層引入了另一個(gè)參數(shù)—擴(kuò)張率割择。

感受野:CNN中,某一層輸出結(jié)果中一個(gè)元素所對應(yīng)的輸入層的區(qū)域大小.难咕。越大的感受野包含越多的上下文關(guān)系泛烙。

空洞卷積理卑,在標(biāo)準(zhǔn)的的卷積核里注入空洞,正常的卷積核中dialate rate=1

背景:FCN都是通過pooling和upsample蔽氨,會(huì)損失一些信息藐唠,就在想能不能不通過pooling也可以獲得較大的感受野看到更多的信息,因此答案就是dialate conv

最大的好處:(ex:dialate=2是每隔一個(gè)像素位置應(yīng)用一個(gè)卷積元素鹉究,雖然可以看到卷積內(nèi)核大小只有3*3宇立,實(shí)際上這個(gè)卷積感受野已經(jīng)增大到7*7。僅僅使用9個(gè)參數(shù)自赔,不做pooling的情況下妈嘹,讓每個(gè)卷積輸出都包含較大范圍的信息,這樣及降低了成本同時(shí)還擴(kuò)大了感受野)

DeepLab 系列

主要針對深度卷積神經(jīng)網(wǎng)絡(luò)的兩個(gè)問題:1.pooling操作使圖片尺寸變小绍妨,2.pooling輸入小變化的不變性润脸。

DeepLab系列是結(jié)合了深度卷積網(wǎng)絡(luò)(DCNNS)和概率圖模型(DenseCRFS)

空洞卷積擴(kuò)大感受野+CRF嘗試找到圖像像素之間的關(guān)系 : 相近的像素大概率為同一標(biāo)簽柬脸。(簡單來說,對一個(gè)像素進(jìn)行分類的時(shí)候毙驯,不僅考慮DCNN的輸出倒堕,而且考慮該像素點(diǎn)周圍像素點(diǎn)的值,這樣語言分割結(jié)果邊界更清楚)

v2:提出了空洞空間金字塔池化(atrous spatial pyramid pooling, ASPP)爆价,使用多個(gè)采樣率采樣得到的多尺度分割對象獲得了更好的分割效果垦巴。

? ? ? (由于DCNN連續(xù)的池化和下采樣造成的分辨率降低)最后的兩個(gè)池化層去掉了下采樣并且后續(xù)卷積層的卷積核改為了空洞卷積,拓展了感受野,獲取更多的語境信息铭段。

基礎(chǔ)層使用了resnet骤宣。使用不同的學(xué)習(xí)率策略。

v3:增強(qiáng)ASPP模塊(1個(gè)1*1conv,3個(gè)3*3conv,包含全劇平均池化)序愚。

復(fù)制resnet最后的block級聯(lián)起來憔披,加入BN。沒有使用CRFs

所有分支得到的結(jié)果concate起來通過1×1卷積之后得到最終結(jié)果展运。

v3+:ASPP方法的優(yōu)點(diǎn)是該種結(jié)構(gòu)可以提取比較dense的特征活逆,因?yàn)閰⒖剂瞬煌叨鹊膄eature精刷,并且atrous convolution的使用加強(qiáng)了提取dense特征的能力拗胜。

但是在該種方法中由于pooling和有stride的conv的存在,使得分割目標(biāo)的邊界信息丟失嚴(yán)重怒允。

Encoder-Decoder方法的decoder中就可以起到修復(fù)尖銳物體邊界的作用埂软。

第七類:基于遞歸神經(jīng)網(wǎng)路的模型

盡管cnn在處理計(jì)算機(jī)視覺問題時(shí)是非常有優(yōu)秀的解決方案,但是并不是唯一的纫事,引出了以rnn為基礎(chǔ)的DL模型勘畔。

renet

因?yàn)樽髡哒J(rèn)為cnn當(dāng)中的conv+pooling會(huì)使圖像信息丟失嚴(yán)重,因此作者使用rnn來避免這種操作丽惶。

每個(gè)renet層含有四個(gè)rnn他們在兩個(gè)方向上水平和垂直來掃描圖像炫七,用這個(gè)renet層替換掉pooling+conv,通過前一層的fp钾唬,進(jìn)行這四個(gè)方向的掃描完成特征學(xué)習(xí)的過程万哪。

reseg model

第一步:從網(wǎng)絡(luò)的結(jié)構(gòu)我們可以看出來,reseg應(yīng)用了3次串聯(lián)的renet模塊抡秆,空間分辨率在不斷減小奕巍,為了將vgg16提取出來的特征進(jìn)一步處理,從而得到對輸入圖像更復(fù)雜的特征描述儒士。

第二部:在特征提取后的止,fp的空間分辨率下降到八分之一,采用了由若干層反卷積組成的上采樣層着撩,恢復(fù)分辨率

第三步:最后簡單的應(yīng)用softmax來實(shí)現(xiàn)segmentation

第八類:注意力機(jī)制

深度學(xué)習(xí)的注意力機(jī)制和人類的注意力本質(zhì)上是一個(gè)意思诅福,核心目標(biāo)也是從公眾信息中選擇出對當(dāng)前任務(wù)更加關(guān)鍵的信息匾委;在數(shù)學(xué)公式和代碼實(shí)現(xiàn)就是attention可以理解為加權(quán)求和

chen提出了一種多尺度圖像和注意力機(jī)制相結(jié)合(學(xué)習(xí)在每個(gè)像素位置對多尺度特征進(jìn)行加權(quán)求和)。注意力機(jī)制是要優(yōu)于平均和最大池化氓润,該模型能夠評估不同位置和尺度特征的重要性剩檀。

RAN(反向注意力機(jī)制)框架:本文提出了一種使用反向注意機(jī)制的語義分割方法。RAN是一個(gè)三分支的網(wǎng)絡(luò)旺芽,它同時(shí)執(zhí)行直接注意和反向注意學(xué)習(xí)過程沪猴。最上分支,學(xué)習(xí)的是像素不屬于各個(gè)類別的概率分布采章;最下分支运嗜,學(xué)習(xí)的是pixel屬于各個(gè)類別的概率分布;中間reverse attention 分支悯舟,學(xué)習(xí)的是某個(gè)類別和不是某個(gè)類別概率的Feature之間結(jié)合的權(quán)重(從原始預(yù)測中直接減去反向預(yù)測)担租。最終下分支與reverse attention 分支融合后的Feature進(jìn)行預(yù)測分割

主要作用:為了提高對類別混合區(qū)域的目標(biāo)分割精度,提高混合區(qū)域分割 的準(zhǔn)確率抵怎。

Li提出將注意力機(jī)制與空間金字塔相結(jié)合奋救,來提取精確的密集特征進(jìn)行像素標(biāo)記,而不是復(fù)雜的放大卷板機(jī)換個(gè)人工設(shè)計(jì)的解碼器網(wǎng)絡(luò)反惕。

Fu提出了用于場景分割的雙注意網(wǎng)絡(luò)尝艘,基于自注意力機(jī)制,能夠捕捉豐富的上下文信息姿染,添加了兩個(gè)注意力模塊(position attention moudle和channel attention moudle)

OCNet EMANet CCNet DFN

第九類:基于GAN的模型

CNN的分割網(wǎng)絡(luò)可以用于GAN的生成器背亥,所以只需要設(shè)計(jì)對抗網(wǎng)絡(luò),設(shè)計(jì)Loss悬赏。對抗網(wǎng)絡(luò)也可以用于來源于已經(jīng)提出的卷積網(wǎng)絡(luò)模型狡汉。

框架:生成器輸入RGB圖像,生成器是分割網(wǎng)絡(luò)闽颇,用于逐像素分類預(yù)測盾戴,輸出分類預(yù)測圖。對抗網(wǎng)絡(luò)將分割結(jié)果 / GroundTruth二值圖 和原圖進(jìn)行了相乘兵多,得到的結(jié)果做為輸入尖啡,最終輸出sigmoid二分類結(jié)果。

第十類:卷積模型于活動(dòng)輪廓模型

近年來中鼠,F(xiàn)CNs與活動(dòng)輪廓模型(ACMs)[7]之間協(xié)同作用的探索引起了人們的廣泛關(guān)注可婶。一種方法是根據(jù)ACM原理建立新的損失函數(shù)。一種不同的方法最初只是試圖利用ACM作為FCN輸出的后處理器援雇,一些努力試圖通過預(yù)先訓(xùn)練FCN來進(jìn)行適度的協(xié)同學(xué)習(xí)矛渴。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子具温,更是在濱河造成了極大的恐慌蚕涤,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件铣猩,死亡現(xiàn)場離奇詭異揖铜,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)达皿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進(jìn)店門天吓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人峦椰,你說我怎么就攤上這事龄寞。” “怎么了汤功?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵物邑,是天一觀的道長。 經(jīng)常有香客問我滔金,道長色解,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任餐茵,我火速辦了婚禮科阎,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘钟病。我一直安慰自己萧恕,他們只是感情好刚梭,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布肠阱。 她就那樣靜靜地躺著,像睡著了一般朴读。 火紅的嫁衣襯著肌膚如雪屹徘。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天衅金,我揣著相機(jī)與錄音噪伊,去河邊找鬼。 笑死氮唯,一個(gè)胖子當(dāng)著我的面吹牛鉴吹,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播惩琉,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼豆励,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起良蒸,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤技扼,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后嫩痰,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體剿吻,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年串纺,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了丽旅。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,690評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡纺棺,死狀恐怖魔招,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情五辽,我是刑警寧澤办斑,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站杆逗,受9級特大地震影響乡翅,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜罪郊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一蠕蚜、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧悔橄,春花似錦靶累、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至睛挚,卻和暖如春邪蛔,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背扎狱。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工侧到, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人淤击。 一個(gè)月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓匠抗,卻偏偏與公主長得像,于是被迫代替她去往敵國和親污抬。 傳聞我的和親對象是個(gè)殘疾皇子汞贸,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容