人體姿態(tài)估計圖推理網(wǎng)絡(luò)GRR-GCN論文閱讀理解

由上海大學(xué)發(fā)表在2020年的IEEE Access期刊上的論文《Global Relation Reasoning Graph Convolutional Networks for Human Pose Estimation》,使用了GCN實現(xiàn)全局關(guān)系推理,用于人體姿態(tài)估計任務(wù)。

概述

GRR-GCN (Global Relation Reasoning Graph Convolutional Networks) 是一個通用的"plug-and-play module"遥诉,可以嵌入到現(xiàn)有的human pose estimation網(wǎng)絡(luò)中笛辟,通過引入GCN實現(xiàn)"global relation reasoning"嬉愧。

創(chuàng)新點

  • Projection between feature space & graph space

    使得GCN方法用于pixel level的Human Pose Estimation任務(wù)成為可能

  • Global Relation Reasoning

    使用GCN建立了joints之間的全局推理沙庐,每個node中存儲了對應(yīng)關(guān)節(jié)點的feature信息

Motivation

Human Pose Estimation任務(wù)中的一個難點是occlusion等問題狡蝶,需要joints之間做reasoning【铌現(xiàn)有方法的解決思路通常是采用多個stages的思路痒蓬,在前幾個stages先predict出"simple" body joints,后面幾個stages通過不斷增加receptive field來提取joints之間的relationship從而predict "hard" joints滴劲。

Related works

(1) CPN的做法攻晒,GlobalNet先走了simple joints,然后RefineNet使用了GlobalNet上的pyramid features班挖,對于"hard" joints經(jīng)過了更deep的網(wǎng)絡(luò)結(jié)構(gòu)鲁捏。

(2) Stacked Hourglass則是implicitly的做法,通過intermediate supervision來訓(xùn)練網(wǎng)絡(luò)隱式的提取joints relationship萧芙。

注:上述方法全部使用純CNN來實現(xiàn)joints relationship reasoning给梅。

使用純CNN方法reasoning的缺陷

關(guān)節(jié)點之間的距離在RGB空間可能比較遠,純CNN的結(jié)構(gòu)需要經(jīng)過非常deep的網(wǎng)絡(luò)才能使得receptive field足夠大双揪,計算量非常大动羽,同時也會introduce進來一些noise信息。

現(xiàn)有的GCN主要用于行為識別和場景理解等classification問題渔期,對于pixel-level computer vision tasks目前仍缺少GCN的解決方法曹质。

因此在本工作中通過projection和reverse projection的操作,架起了CNN的Euclidian space和GCN的graph space的橋梁擎场,從而把Global Relation Reasoning運用到pixel-level的Human Pose Estimation任務(wù)中羽德。

Projection between feature space & graph space

研究意義

使得在Euclidean space無法直接進行的GCN推理成為可能,這對于檢測skeleton joints來說更方便對關(guān)節(jié)點之間的相關(guān)性建模迅办。推理完之后reverse projection到原來的domain宅静,可以讓skeleton joints推理后的信息反過來幫助網(wǎng)絡(luò)在圖上正確檢測關(guān)節(jié)點。

實現(xiàn)方式如下:

Projection between feature space and graph space

From feature space to graph space

網(wǎng)絡(luò)對skeleton joints提特征得到feature map后站欺,如果使用GCN進行推理姨夹,需要先把domain從feature space變換到graph space,這里的feature map的維度:X\in R^{(W\times H)\times C} (分別表示輸入feature map的寬高和channel數(shù))

由于GCN需要對整個人的skeleton進行整體推理矾策,因此projection的過程需要receptive field到全圖磷账。這里使用了weighted global pooling來實現(xiàn),獲得graph space的F=PX贾虽,其中weight的維度P\in R^{N\times (W\times H)}逃糟,得到的F\in R^{N\times C},其中N表示skeleton joint的個數(shù)。

實際上具體實現(xiàn)時為了減少輸入維度和網(wǎng)絡(luò)參數(shù)量绰咽,使用了一個1\times 1的卷積來對X進行預(yù)處理為\Phi(X)菇肃,因此上式應(yīng)寫成:F=P\Phi(X)

From graph space back to feature space

從graph space使用GCN做完推理后取募,還需要mapping回原來Euclidean space的feature map琐谤,這里設(shè)GCN輸出的feature map的維度Z\in R^{N\times C},這個reverse projection也是使用linear mapping來實現(xiàn):Y=DZ玩敏,這里逆變換的系數(shù)矩陣使用正變換的transpose:D=P^T斗忌。這里系數(shù)D復(fù)用的好處是減少了訓(xùn)練的參數(shù)量和網(wǎng)絡(luò)計算量。

Global Relation Reasoning

GCN中的每個node為了代表對應(yīng)的skeleton joint旺聚,整個GCN的功能是建立關(guān)節(jié)點之間的推理织阳,也就是說讓各個node之間的feature相互聯(lián)系。

這部分為了讓所有的關(guān)節(jié)點之間都可以建立聯(lián)系(實現(xiàn)Global Relation Reasoning)翻屈,采用了全連接的方式,即對N個node采用了N\times N的adjacency matrix妻坝。

具體實現(xiàn)的流程如下圖伸眶。

Global Relation Reasoning

從原始的feature space的X經(jīng)過projection (圖中右側(cè)的那個P)得到graph space,同時X本身通過一個1\times 1conv進行壓縮(減少輸入維度和網(wǎng)絡(luò)參數(shù)量)到\Phi(X)刽宪,這兩路做element-wise sum厘贼,得到F=P\Phi(X) ,這里編碼了所有N個node的feature圣拄,每個node表示對應(yīng)的那個skeleton joint嘴秸,此時使用一個全連接的graph G_g (adjacency matrix的維度是N\times N) 用來實現(xiàn)nodes之間的信息傳遞(實際實現(xiàn)的時候是用一維卷積來實現(xiàn)G_g)。
然后使用了一維卷積E_g來實現(xiàn)state update function庇谆,GCN得到的結(jié)果如下:

Z=((I-G_g)F)E_g

其中G_gE_g這兩個adjacency matrix的weights是隨機初始化岳掐,然后通過end-to-end方法進行訓(xùn)練。

實驗效果

分別使用了HR-Net和Simple-Baseline的方法作為基礎(chǔ)網(wǎng)絡(luò)饭耳。

COCO數(shù)據(jù)集上串述,AP提升了0.2 (HR-Net: 74.9 --> 75.1)和0.3 (Simple-Baseline: 71.5 --> 71.8)

MPII數(shù)據(jù)集上,PCKh@0.5提升了0.1 (HR-Net: 91.2 --> 91.3)

提升的地方主要在于partially occluded的person檢測的更準(zhǔn)確寞肖。

一些疑問

  1. 文中所提出的方法為什么沒有使用人體skeleton的自然連接方式對GCN的adjacency matrix做初始化纲酗,而是random初始化?

  2. Global Relation Reasoning這部分新蟆,經(jīng)過壓縮的feature \Phi(X)與投影后graph空間的P融合方式為什么是相乘觅赊?

    融合后的feature F為什么要減去他本身經(jīng)過fully-connected graph G_g的結(jié)果?

    為什么E_g能實現(xiàn)state update function琼稻?

    最后reverse projection后的結(jié)果與GRR部分的輸入又做了一次相加的意義何在吮螺?

    對于這一塊的實現(xiàn)方式我表示有很多問號。

  3. 實驗結(jié)果只提升了很少,但是對于不同的pose estimation方法规脸,要分別設(shè)置GCN的引入位置坯约,花了這么多設(shè)計的代價換來很少的準(zhǔn)確率提升值得嗎?

  4. 文章的審稿質(zhì)量并不敢完全保證很好莫鸭,即使在publication的版本中闹丐,仍有英語語法錯誤,例如Sec. III-A中被因,

    "However, because convolution operations can only model local relations, so most of the state-of-theart methods have to inefficiently build deep network layers to capture global relations between different human keypoints."

    由此推測作者可能是先寫了中文草稿然后翻譯投稿的卿拴。

Reference

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市梨与,隨后出現(xiàn)的幾起案子堕花,更是在濱河造成了極大的恐慌,老刑警劉巖粥鞋,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件缘挽,死亡現(xiàn)場離奇詭異,居然都是意外死亡呻粹,警方通過查閱死者的電腦和手機壕曼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來等浊,“玉大人腮郊,你說我怎么就攤上這事〕镅啵” “怎么了轧飞?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長撒踪。 經(jīng)常有香客問我过咬,道長,這世上最難降的妖魔是什么制妄? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任援奢,我火速辦了婚禮,結(jié)果婚禮上忍捡,老公的妹妹穿的比我還像新娘集漾。我一直安慰自己,他們只是感情好砸脊,可當(dāng)我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布具篇。 她就那樣靜靜地躺著,像睡著了一般凌埂。 火紅的嫁衣襯著肌膚如雪驱显。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天,我揣著相機與錄音埃疫,去河邊找鬼伏恐。 笑死,一個胖子當(dāng)著我的面吹牛栓霜,可吹牛的內(nèi)容都是我干的翠桦。 我是一名探鬼主播,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼胳蛮,長吁一口氣:“原來是場噩夢啊……” “哼销凑!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起仅炊,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤斗幼,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后抚垄,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蜕窿,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年呆馁,在試婚紗的時候發(fā)現(xiàn)自己被綠了桐经。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡智哀,死狀恐怖次询,靈堂內(nèi)的尸體忽然破棺而出荧恍,到底是詐尸還是另有隱情瓷叫,我是刑警寧澤,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布送巡,位于F島的核電站摹菠,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏骗爆。R本人自食惡果不足惜次氨,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望摘投。 院中可真熱鬧煮寡,春花似錦、人聲如沸犀呼。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽外臂。三九已至坐儿,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背貌矿。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工炭菌, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人逛漫。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓黑低,卻偏偏與公主長得像,于是被迫代替她去往敵國和親尽楔。 傳聞我的和親對象是個殘疾皇子投储,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容