閱讀筆記- Li3DeTr: A LiDAR based 3D Detection Transformer


這篇文章整體沒(méi)什么好說(shuō)的阻荒,只是將Deformable DETR應(yīng)用到了LiDAR 3D檢測(cè)任務(wù)上盛险,所以我們這里看一下其細(xì)節(jié)部分就行拯欧。

1. 方法

下圖是Li3DeTr 的整體結(jié)構(gòu)拱烁, 首先網(wǎng)絡(luò)的輸入是由LiDAR得到的點(diǎn)云數(shù)據(jù)霜定,點(diǎn)云首先經(jīng)過(guò)SparseConv 或者 PointPillars 網(wǎng)絡(luò)將點(diǎn)云數(shù)據(jù)轉(zhuǎn)到BEV上,然后經(jīng)過(guò)FPN生成多尺度的BEV特征思喊,這里 (SparseConv/PointPillars + FPN)稱為backbone部分壁酬,然后經(jīng)過(guò)由多層encoder layer組成的encoder部分,encoder部分和deformable DETR中的定義相同恨课,每個(gè)feature map上的pixel作為query舆乔,來(lái)自多l(xiāng)evel的特征圖由deformable 形式選擇的點(diǎn)作為value進(jìn)行融合,融合后的特征稱為L(zhǎng)iDAR Global Features, 接著將global features 送入到decoder中進(jìn)行解碼剂公,這里和deformable detr的操作也類(lèi)似希俩,即一組可學(xué)習(xí)參數(shù)稱為queries,先經(jīng)過(guò)MHSA交互纲辽,再送入cross attention中與global feature交互颜武,cross attention中同樣采用的deformable attention的形式降低計(jì)算量,注意cross attention中deformable使用的ref_pts 由queries經(jīng)過(guò)單層線性層映射得到拖吼。decoder 由多層decoder layer構(gòu)成鳞上,最終輸出進(jìn)行set2set_prediction的監(jiān)督約束。


image.png

ok吊档,接下來(lái)看下細(xì)節(jié):

  • encoder 完全采用的deformable detr的detr結(jié)構(gòu)
  • decoder layer的每一層ref_pts, 由輸入query經(jīng)FC生成篙议, r_i = \phi_{ref}(q_i)
  • decoder layer 中attention的計(jì)算方式 F_i^{CAttn} = \sum_{j=1}^4F_j(R_{ji}(r_i))w_{ij}, 其中F_j表示第j層的global feat,總共4個(gè)level籍铁, R_{ji}(r_i)表示將第i個(gè)ref_pts 映射到第j個(gè)level尺度上的位置涡上,w_{ij}是由q_i經(jīng)過(guò)FC層生成的,可以發(fā)現(xiàn)和deformable attention相比拒名,這里沒(méi)有生成offset吩愧,而是每個(gè)level的feat上只取對(duì)應(yīng)ref_pts位置的雙線性插值特征進(jìn)行加權(quán)和。最后query的更新方式為q_i = q_i + F_i^{CAttn} + PE(c_i) 這里PE(c_i) 是對(duì)ref_pts的位置編碼增显,有點(diǎn)奇怪的是這里是在skip-connection的基礎(chǔ)上又加上了位置編碼雁佳,然后再進(jìn)行LayerNorm?
  • decoder layer的每一層bbox_embed 預(yù)測(cè)的是相對(duì)于前一層layer的ref_pts的delta增量同云,包括\delta p_i \in R^3, (l_i, w_i, h_i), sin \theta_i, cos \theta_i, v_{xi}, v_{y_i}.

2. 實(shí)驗(yàn)

消融實(shí)驗(yàn)

  • object category
    文章對(duì)比的transformer方法是Object-DGCNN糖权,因?yàn)樽髡哒J(rèn)為該模型是和本文方法類(lèi)似的standalone transformer 模型,對(duì)比更公平炸站。作者認(rèn)為該方法由于使用多尺度的deformable attention能夠充分利用lidar的更長(zhǎng)距離特征星澳,因此對(duì)于大目標(biāo)提升更明顯,比如vehicle旱易、trailer禁偎,truck等腿堤,即使是數(shù)目較少的bicycle類(lèi)本文方法相對(duì)于Obj-DGCNN也提升了6.9個(gè)點(diǎn),作者認(rèn)為是cross attention中l(wèi)ocal和global特征的抽取如暖。


    image.png
  • object distance
    本文對(duì)30m外的目標(biāo)的指標(biāo)mAP提升最明顯笆檀,作者認(rèn)為是本文的attention 建模了long-range的交互,即使遠(yuǎn)處的點(diǎn)云較稀疏盒至。


    image.png
  • object size
    基于transformer的目標(biāo)在大目標(biāo)上的提升會(huì)更高一些酗洒。


    image.png
  • attention blocks
    這個(gè)地方?jīng)]有搞懂為什么本文的cross attention和deformable detr差距不大但指標(biāo)帶來(lái)這么大變化,需要看下代碼枷遂。
  • number of queries
    900個(gè)query效果最好樱衷,這個(gè)可能得依賴具體的任務(wù)場(chǎng)景

3. 結(jié)論

本質(zhì)就是DeformableDETR在LiDAR數(shù)據(jù)上的應(yīng)用。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末登淘,一起剝皮案震驚了整個(gè)濱河市箫老,隨后出現(xiàn)的幾起案子封字,更是在濱河造成了極大的恐慌黔州,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,270評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件阔籽,死亡現(xiàn)場(chǎng)離奇詭異流妻,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)笆制,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)绅这,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人在辆,你說(shuō)我怎么就攤上這事证薇。” “怎么了匆篓?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,630評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵浑度,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我鸦概,道長(zhǎng)箩张,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,906評(píng)論 1 295
  • 正文 為了忘掉前任窗市,我火速辦了婚禮先慷,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘咨察。我一直安慰自己论熙,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,928評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布摄狱。 她就那樣靜靜地躺著脓诡,像睡著了一般素跺。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上誉券,一...
    開(kāi)封第一講書(shū)人閱讀 51,718評(píng)論 1 305
  • 那天指厌,我揣著相機(jī)與錄音,去河邊找鬼踊跟。 笑死踩验,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的商玫。 我是一名探鬼主播箕憾,決...
    沈念sama閱讀 40,442評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼拳昌!你這毒婦竟也來(lái)了袭异?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,345評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤炬藤,失蹤者是張志新(化名)和其女友劉穎御铃,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體沈矿,經(jīng)...
    沈念sama閱讀 45,802評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡上真,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,984評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了羹膳。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片睡互。...
    茶點(diǎn)故事閱讀 40,117評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖陵像,靈堂內(nèi)的尸體忽然破棺而出就珠,到底是詐尸還是另有隱情,我是刑警寧澤醒颖,帶...
    沈念sama閱讀 35,810評(píng)論 5 346
  • 正文 年R本政府宣布妻怎,位于F島的核電站,受9級(jí)特大地震影響图贸,放射性物質(zhì)發(fā)生泄漏蹂季。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,462評(píng)論 3 331
  • 文/蒙蒙 一疏日、第九天 我趴在偏房一處隱蔽的房頂上張望偿洁。 院中可真熱鬧,春花似錦沟优、人聲如沸涕滋。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,011評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)宾肺。三九已至溯饵,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間锨用,已是汗流浹背丰刊。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,139評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留增拥,地道東北人啄巧。 一個(gè)月前我還...
    沈念sama閱讀 48,377評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像掌栅,于是被迫代替她去往敵國(guó)和親秩仆。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,060評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容