論文筆記 Mask R-CNN

文章來源:ICCV 2017

下載鏈接:Paper Download


解決的問題:

(1) 在時(shí)間上對(duì)Faster R-CNN進(jìn)行了優(yōu)化,并且提高準(zhǔn)確度,最關(guān)鍵的是在像素級(jí)別進(jìn)行特征點(diǎn)定位狡刘,并達(dá)到了將各個(gè)對(duì)象的邊緣確定的效果褪子。

(2) 能夠有效地檢測(cè)圖像中的目標(biāo)存和,同時(shí)還能為每個(gè)實(shí)例生成一個(gè)高質(zhì)量的分割掩碼烟逊。


文章內(nèi)容:

Mask R-CNN是一個(gè)小巧、靈活的通用對(duì)象實(shí)例分割框架互广。它在Faster R-CNN基礎(chǔ)之上進(jìn)行擴(kuò)展敛腌,并行地在bounding box recognition分支上添加一個(gè)用于預(yù)測(cè)目標(biāo)掩模的新分支卧土。該網(wǎng)絡(luò)還很容易擴(kuò)展到其他任務(wù)中,比如關(guān)鍵點(diǎn)檢測(cè)像樊、實(shí)例分割尤莺。該文章主要包括以下三個(gè)創(chuàng)新點(diǎn)。

(1) 解決特征圖與原始圖像上的RoI不對(duì)準(zhǔn)問題生棍。由于RoIPool方法在量化過程中引入了RoI與提取的特征不對(duì)準(zhǔn)問題颤霎,作者提出RoIAlign層來解決這個(gè)問題,并且將提取到的特征與輸入對(duì)齊涂滴。避免了對(duì)RoI的邊界或者塊做任何量化友酱。

(2) 將掩模預(yù)測(cè)和分類預(yù)測(cè)拆解。該框架對(duì)每個(gè)類別獨(dú)立地預(yù)測(cè)一個(gè)二值掩模柔纵,沒有引入類間競(jìng)爭(zhēng)缔杉,每個(gè)二值掩模的類別依靠網(wǎng)絡(luò)RoI分類分支給出的分類預(yù)測(cè)結(jié)果。

(3) 掩模表示搁料。一個(gè)掩模編碼了一個(gè)輸入對(duì)象的空間布局或详。作者使用了一個(gè)FCN來對(duì)每個(gè)RoI預(yù)測(cè)一個(gè)掩模,這保留了空間結(jié)構(gòu)信息郭计。


Figure 1. The MaskR-CNNframework for instance segmentation.

該結(jié)構(gòu)主要包含兩個(gè)分支:

(1) 第一個(gè)分支為原始Faster R-CNN的結(jié)構(gòu)霸琴,它用于對(duì)候選窗口進(jìn)行分類和窗口坐標(biāo)回歸。

(2) 第二個(gè)分支對(duì)每一個(gè)感興趣區(qū)域預(yù)測(cè)分割掩模昭伸,它利用了一個(gè)小的全卷積網(wǎng)絡(luò)結(jié)構(gòu)梧乘。

另外,作者對(duì)ROI的損失函數(shù)進(jìn)行了重新定義庐杨,公式如下所示:

公式(1)

對(duì)每個(gè)RoI的mask分支选调,其輸出維度為Km*m。其中K表示對(duì)m*m的圖像編碼K個(gè)二分類mask灵份,每一個(gè)mask有K個(gè)類別学歧。所以需要應(yīng)用單像素的sigmoid進(jìn)行二分類,并定義Lmask為平均二分類cross-entropy loss各吨。對(duì)于類別為k的RoI,Lmask定義在第k個(gè)掩膜(其他掩膜輸出對(duì)loss沒貢獻(xiàn))袁铐。


文章特點(diǎn):

Mask R-CNN是一個(gè)小巧揭蜒、靈活的通用對(duì)象實(shí)例分割框架(object instance segmentation)。它不僅可對(duì)圖像中的目標(biāo)進(jìn)行檢測(cè)剔桨,還可以對(duì)每一個(gè)目標(biāo)給出一個(gè)高質(zhì)量的分割結(jié)果屉更。該框架在COCO的一些列挑戰(zhàn)任務(wù)重都取得了最好的結(jié)果,包括實(shí)例分割(instance segmentation)洒缀、候選框目標(biāo)檢測(cè)(bounding-box object detection)和人關(guān)鍵點(diǎn)檢測(cè)(person keypoint detection)瑰谜。

(1) 由于目前已有許多設(shè)計(jì)良好欺冀,可用于Faster R-CNN的構(gòu)架,因此萨脑,作為Faster R-CNN的擴(kuò)展隐轩,Mask R-CNN在應(yīng)用時(shí)也沒有阻礙;

(2) 由于掩碼層只給整個(gè)系統(tǒng)增加一小部分計(jì)算量渤早,所以該方法運(yùn)行起來非常高效职车;

(3) Mask R-CNN還可以很容易泛化到其它任務(wù)上。比如鹊杖,可以在同一個(gè)框架中估計(jì)人物的動(dòng)作悴灵。


存在的不足:

暫時(shí)沒發(fā)現(xiàn)。


相關(guān)參考:Mask R-CNN個(gè)人理解骂蓖、多位大神解讀积瞒、《Mask R-CNN》-2017


內(nèi)容說明:

上述內(nèi)容僅個(gè)人的點(diǎn)滴粗見,如有不當(dāng)之處登下,請(qǐng)同行批評(píng)指正茫孔。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市庐船,隨后出現(xiàn)的幾起案子银酬,更是在濱河造成了極大的恐慌,老刑警劉巖筐钟,帶你破解...
    沈念sama閱讀 212,884評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件揩瞪,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡篓冲,警方通過查閱死者的電腦和手機(jī)李破,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,755評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來壹将,“玉大人嗤攻,你說我怎么就攤上這事》谈” “怎么了妇菱?”我有些...
    開封第一講書人閱讀 158,369評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)暴区。 經(jīng)常有香客問我闯团,道長(zhǎng),這世上最難降的妖魔是什么仙粱? 我笑而不...
    開封第一講書人閱讀 56,799評(píng)論 1 285
  • 正文 為了忘掉前任房交,我火速辦了婚禮,結(jié)果婚禮上伐割,老公的妹妹穿的比我還像新娘候味。我一直安慰自己刃唤,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,910評(píng)論 6 386
  • 文/花漫 我一把揭開白布白群。 她就那樣靜靜地躺著尚胞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪川抡。 梳的紋絲不亂的頭發(fā)上辐真,一...
    開封第一講書人閱讀 50,096評(píng)論 1 291
  • 那天,我揣著相機(jī)與錄音崖堤,去河邊找鬼侍咱。 笑死,一個(gè)胖子當(dāng)著我的面吹牛密幔,可吹牛的內(nèi)容都是我干的楔脯。 我是一名探鬼主播,決...
    沈念sama閱讀 39,159評(píng)論 3 411
  • 文/蒼蘭香墨 我猛地睜開眼胯甩,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼昧廷!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起偎箫,我...
    開封第一講書人閱讀 37,917評(píng)論 0 268
  • 序言:老撾萬榮一對(duì)情侶失蹤木柬,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后淹办,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體眉枕,經(jīng)...
    沈念sama閱讀 44,360評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,673評(píng)論 2 327
  • 正文 我和宋清朗相戀三年怜森,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了速挑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,814評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡副硅,死狀恐怖姥宝,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情恐疲,我是刑警寧澤腊满,帶...
    沈念sama閱讀 34,509評(píng)論 4 334
  • 正文 年R本政府宣布,位于F島的核電站培己,受9級(jí)特大地震影響糜烹,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜漱凝,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,156評(píng)論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望诸迟。 院中可真熱鬧茸炒,春花似錦愕乎、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至紊册,卻和暖如春比肄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背囊陡。 一陣腳步聲響...
    開封第一講書人閱讀 32,123評(píng)論 1 267
  • 我被黑心中介騙來泰國(guó)打工芳绩, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人撞反。 一個(gè)月前我還...
    沈念sama閱讀 46,641評(píng)論 2 362
  • 正文 我出身青樓妥色,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親遏片。 傳聞我的和親對(duì)象是個(gè)殘疾皇子嘹害,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,728評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容