GVCNN: Group-View Convolutional Neural Networks for 3D Shape Recognition CVPR2018論文閱讀筆記

GVCNN notes

思路總結(jié)與方法概括

GVCNN和MVCNN一樣翘簇,也是一種基于多視圖(multi-view)的锅铅、對三維物體進行識別分類的網(wǎng)絡(luò)結(jié)構(gòu)锁施。

在MVCNN中挑胸,各個view的CNN特征通過一個view pooling層被整合成一個特征向量。這么做的缺憾在于夷狰,view pooling層并不能關(guān)注每個view的區(qū)分性岭皂。而實際上,在使用multi-view來對一個三維物體進行表示時沼头,有些view之間的相似性可能會很高爷绘,而有些view之間的差別卻比較大,挖掘出這些view之間的相互聯(lián)系也許能夠幫助網(wǎng)絡(luò)更好地進行物體識別进倍。

而GVCNN的核心思路便是基于上述的觀測土至,它提出了一個c,用于對不同的view-level特征進行分組猾昆,并以組為單位對view-level特征進行聚合從而得到group-level的特征陶因,最后通過一個學(xué)習(xí)到的權(quán)重來將group-level特征整合成一個全局特征描述子,以用于最終的分類毡庆。引入Grouping Module的好處在于,它考慮了view之間的組內(nèi)相似性和組間區(qū)分性:相似度高的view被分到了同一組烙如,組內(nèi)特征對最終結(jié)果的影響因子是相同的么抗;而不同的組間具有相對明顯的區(qū)分性,因此每個組對最終結(jié)果的影響程度會不同亚铁。

具體結(jié)構(gòu)

整體流程
架構(gòu)
  1. 表示一個三維物體的多個view首先被送入一個全卷積網(wǎng)絡(luò)(Fully Convolutional Network)進行初步的特征提取蝇刀,得到每個view的Raw View Descriptor,這里的FCN對于各個view而言是共享的徘溢。假設(shè)我們用 n 個view來表示一個三維物體吞琐,那么經(jīng)過FCN,我們就會得到 NRaw View Descriptor然爆。
  2. 提出得到的Raw View Descriptor接著被送入余下的CNN中進行進一步的特稱提取站粟,得到與每個view相對應(yīng)的Final View Descriptor。類似地曾雕,這里的CNN也是view間共享的奴烙。相應(yīng)地,這里我們也會得到 NFinal View Descriptor
  3. 同時剖张,由第1步提取得到的所有Raw View Descriptor還會被一起送入Grouping Module來進行組別的劃分切诀,并計算出各個組別的對應(yīng)權(quán)重。Grouping Module有兩個計算結(jié)果搔弄,分別是圖中的Grouping Scheme和Grouping Weight幅虑。其中Grouping Scheme用來對view-level的特征進行分組。而Grouping Weight則是分配給各個組的權(quán)重顾犹,用于接下來的特征整合倒庵。Grouping Module的具體細節(jié)將會在下文討論褒墨。
  4. 接著,由第2步得到的 NFinal View Descriptor會根據(jù)第3步計算得出的結(jié)果來進行分組哄芜,分組的個數(shù)依賴于具體的數(shù)據(jù)貌亭,我們將分組個數(shù)記作 m
  5. 接下來认臊,在各個組內(nèi)進行view pooling操作(文章里使用的是average pooling)圃庭,得到 MGroup Descriptor
  6. 根據(jù)第3步得出的Grouping Weight對第5步得到的Group Descriptor進行加權(quán)求和失晴,得到最終的全局描述子shape descriptor剧腻。
  7. 使用一個全連接層對第6步得出的全局描述子進行分類。
Grouping Module
分組模塊

前面提到涂屁,Grouping Module的輸出有兩部分书在。一個是Grouping Scheme,用來確定如何劃分組別拆又。一個是Grouping Weight儒旬,是分配給每個組別的權(quán)重,權(quán)重表示每個組對最終的全局特征描述子的貢獻度帖族。

1. 計算區(qū)分度

在對各個view進行組別劃分之前栈源,先要得到每個view的區(qū)分度(Discrimination Scores),然后才能根據(jù)每個view的區(qū)分度來對其進行分組竖般。Grouping Module的輸入是 NRaw View Descriptor甚垦,這 NRaw View Descriptor首先被分別輸入到一個共享的全連接層中,得到 N 個相應(yīng)的輸出值涣雕。假設(shè)輸入的一組view為S = \{I_1,I_2,...,I_N\}艰亮, 對應(yīng)的全連接層的輸出值為\{O_{I_1},O_{I_2},...,O_{I_N}\},那么每個view的區(qū)分度的計算方式為:
\xi(I_i) = sigmoid(log(abs(O_{I_i})))
引入sigmoid函數(shù)挣郭,就使得區(qū)分度的取值落在0~1之間迄埃。注意到當(dāng)sigmoid的輸入高于5或小于-5時,其函數(shù)值便會趨向1或者0兑障,這將不利于分組的進行调俘。為了使得取值分布更加均勻,作者在sigmoid之前引入了abs和log函數(shù)旺垒。

2. 根據(jù)區(qū)分度進行分組

有了每個view的區(qū)分度彩库,便可以對其進行分組了。分組的思路十分簡單先蒋,具體如下:

首先將區(qū)間(0, 1)平均劃分為 N 個子區(qū)間骇钦,接著依次查看每個view的區(qū)分度,區(qū)分度落在同一個子區(qū)間的view就被認為屬于同一個組竞漾。最后便得到 M 個互不相交的分組 \{G_1, G_2,...,G_M\}眯搭,并且有 1\le M \le N窥翩。

3. 計算每個分組的權(quán)重

分組的權(quán)重用于對Group Descriptor進行加權(quán)平均,已得到最后的shape descriptor鳞仙。因此寇蚊,權(quán)重的計算原則是:一個區(qū)分性高的組,應(yīng)分配一個高的權(quán)重棍好,反之則應(yīng)該分配一個小的權(quán)重仗岸。權(quán)重的計算方式為:
\xi(G_j) = \frac{Ceil(\xi_{I_k} \times |G_j|)}{|G_j|}, \ \ \ \ I_k \in G_j
不過感覺論文這里應(yīng)該漏了累加或者Max之類的操作符,因為單從公式上來看借笙,并不知道I_k的具體取值扒怖。具體細節(jié)可能要去代碼中查看了。业稼。

實驗

實驗證明盗痒,GVCNN相對于MVCNN有2到3個百分點的提升。但有一部分的提升實際上是來自于GoogLeNet(GVCNN所使用的CNN baseline)相對于VGG-M(MVCNN所使用的CNN baseline)的優(yōu)勢低散。這樣看來俯邓,Grouping Module所帶來的實際性能提升其實只有一個百分點左右。

比起分類準(zhǔn)確率的提高熔号,論文中對Grouping Module的討論和實驗展示其實才是點睛之筆稽鞭。

分組結(jié)果

從展示的分組樣例可以看出,Grouping Module對view的組別劃分還是十分到位的跨嘉。雖然最后的精度提升不是十分明顯川慌,但Grouping Module的作用仍值得肯定吃嘿。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末祠乃,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子兑燥,更是在濱河造成了極大的恐慌亮瓷,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,284評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件降瞳,死亡現(xiàn)場離奇詭異嘱支,居然都是意外死亡,警方通過查閱死者的電腦和手機挣饥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評論 3 395
  • 文/潘曉璐 我一進店門除师,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人扔枫,你說我怎么就攤上這事汛聚。” “怎么了短荐?”我有些...
    開封第一講書人閱讀 164,614評論 0 354
  • 文/不壞的土叔 我叫張陵倚舀,是天一觀的道長叹哭。 經(jīng)常有香客問我,道長痕貌,這世上最難降的妖魔是什么风罩? 我笑而不...
    開封第一講書人閱讀 58,671評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮舵稠,結(jié)果婚禮上超升,老公的妹妹穿的比我還像新娘。我一直安慰自己柱查,他們只是感情好廓俭,可當(dāng)我...
    茶點故事閱讀 67,699評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著唉工,像睡著了一般研乒。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上淋硝,一...
    開封第一講書人閱讀 51,562評論 1 305
  • 那天雹熬,我揣著相機與錄音,去河邊找鬼谣膳。 笑死竿报,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的继谚。 我是一名探鬼主播烈菌,決...
    沈念sama閱讀 40,309評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼花履!你這毒婦竟也來了芽世?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,223評論 0 276
  • 序言:老撾萬榮一對情侶失蹤诡壁,失蹤者是張志新(化名)和其女友劉穎济瓢,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體妹卿,經(jīng)...
    沈念sama閱讀 45,668評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡旺矾,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,859評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了夺克。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片箕宙。...
    茶點故事閱讀 39,981評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖铺纽,靈堂內(nèi)的尸體忽然破棺而出柬帕,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 35,705評論 5 347
  • 正文 年R本政府宣布雕崩,位于F島的核電站魁索,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏盼铁。R本人自食惡果不足惜粗蔚,卻給世界環(huán)境...
    茶點故事閱讀 41,310評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望饶火。 院中可真熱鬧鹏控,春花似錦、人聲如沸肤寝。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽鲤看。三九已至缘揪,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間义桂,已是汗流浹背找筝。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留慷吊,地道東北人袖裕。 一個月前我還...
    沈念sama閱讀 48,146評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像溉瓶,于是被迫代替她去往敵國和親急鳄。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,933評論 2 355

推薦閱讀更多精彩內(nèi)容