DetZero的refine部分理解

首先,為了與refine部分配合层玲,detzero的track部分和傳統(tǒng)MOT方法有所不同盐须。
detzero的track將score低于閾值的框也保留下來,做二級(jí)的匹配和更新衔瓮,并且使用了immortal track的思想浊猾,盡量保留更多的框。
在track之后我們得到了點(diǎn)集\{\mathcal{P_{j,i}}\}, 框集\{\mathcal{B_{j,i}}\}和分?jǐn)?shù)集\{\mathcal{S_{j,i}}\}热鞍, j表示track id葫慎, i表示frame id。

概述

基于剛體不變性碍现、運(yùn)動(dòng)規(guī)律性幅疼,并與相鄰時(shí)刻具有較強(qiáng)的一致性,提出了將邊界框回歸分為了3個(gè)獨(dú)立模塊昼接,分別爽篷,預(yù)測(cè)對(duì)象的幾何、位置慢睡、置信度屬性逐工。

Geometry refining model (GRM)

  1. 一個(gè)對(duì)象j的track內(nèi)的所有成員box中點(diǎn),轉(zhuǎn)到box的局部坐標(biāo)系漂辐,并融合泪喊,忽略其來源。 從中隨機(jī)挑選4096個(gè)點(diǎn)記為點(diǎn)集 \mathcal{P_j}=\{p_1,...,p_n\}, n=4096, 做后續(xù)處理髓涯。
  2. 對(duì)于點(diǎn)集中的每一個(gè)點(diǎn)p_k,計(jì)算其到所在框b_{j,i}6個(gè)面的距離袒啼,那么這個(gè)點(diǎn)的特征就擴(kuò)充成了[p_k, \triangle \mathcal{p^{sf1}_k},...,\triangle \mathcal{p^{sf6}_k}] 。
  3. 首先從一個(gè)對(duì)象的track中隨機(jī)選出t個(gè)成員纬纪,每個(gè)成員隨機(jī)選256個(gè)點(diǎn)蚓再,每個(gè)點(diǎn)用2的方法擴(kuò)充特征,并附帶相應(yīng)的置信度得分包各。然后用Pointnet結(jié)構(gòu)的編碼器ENC1來提取每個(gè)選定樣本的特征摘仅,用來初始化幾何查詢Q^{geo}\in{R^{t\times7ccjnw2}},接下來用另一個(gè)編碼器ENC2以\mathcal{P_{j}}作為輸入问畅,提取密集點(diǎn)的特征娃属,作為K^{geo}V^{geo}\in{R^{n\times2ffljwm}}
  4. 首先Q^{geo}輸入MSA中护姆,以編碼選定樣本之間的豐富上下文關(guān)系和特征依賴矾端,從而細(xì)化幾何信息。然后做交叉注意力卵皂,將上下文聚合到對(duì)象候選區(qū)域须床,通過推理成對(duì)差異來補(bǔ)償每個(gè)Q^{geo}的視角的點(diǎn)特征。最后FFN將t個(gè)Q^{geo}獨(dú)立解碼成t個(gè)幾何尺寸渐裂,取平均值作為最終預(yù)測(cè)尺寸豺旬。
  5. 網(wǎng)絡(luò)結(jié)構(gòu):encoder使用多層感知機(jī)MLP钠惩,Q編碼為tx256, K,V編碼為nx256。decoder使用transformer經(jīng)典的MSA+MCA+FFN族阅。

Position refining model(PRM)

  1. 一個(gè)對(duì)象j的track內(nèi)的所有成員box篓跛,隨機(jī)選其中一個(gè)box作為新坐標(biāo)系,然后把其他所有的\{\mathcal{P_{j,i}}\}\{\mathcal{B_{j,i}}\}都轉(zhuǎn)到該坐標(biāo)系坦刀。然后每個(gè)frame的\{\mathcal{P_{j,i}}\}隨機(jī)選取固定數(shù)量的點(diǎn)愧沟,數(shù)量為n^{pos}
  2. 對(duì)于每個(gè)點(diǎn)鲤遥,計(jì)算其到所在框的中心點(diǎn)和8個(gè)角點(diǎn)的距離沐寺,以擴(kuò)充該點(diǎn)的特征,即position-aware的點(diǎn)盖奈,最后以f_k^{pos}=[p_k, \triangle \mathcal{p^{ce}_k},\triangle \mathcal{p^{co1}_k},...,\triangle \mathcal{p^{co8}_k}] 來表示混坞。將每個(gè)track用0 padding到一樣的長(zhǎng)度(即clip的長(zhǎng)度)。
  3. 用ENC1一樣的結(jié)構(gòu)編碼f^{pos}+置信度钢坦,生成position query Q^{pos}\in{R^{L\timesutpthne}} ,L即clip長(zhǎng)度究孕。 同時(shí)用另一個(gè)編碼器以f^{pos}為輸入生成K^{pos}V^{pos}\in{R^{n^{pos}\timesfyjuf2f}}
  4. 首先將 Q^{pos}輸入MSA爹凹,捕捉自身與其他位置的相對(duì)距離厨诸。此外,在每個(gè)查詢位置附近應(yīng)用1D掩碼來加權(quán)自注意力禾酱。 隨后將QKV輸入交叉注意力微酬。 最后,預(yù)測(cè)每個(gè)GT中心和對(duì)應(yīng)的初始中心在局部坐標(biāo)系下的偏移量以及航向角颤陶。

Confidence refining (CRM)

由于detzero的detection和tracking部分的策略是盡可能提高召回颗管,所以會(huì)產(chǎn)生數(shù)量可觀的false positive。所以confidence refining是必要的指郁,該模塊包含了兩個(gè)分支忙上。

  1. 分類分支:設(shè)定兩個(gè)閾值\tau_l\tau_h拷呆,如果track boxes與gt的閾值低于\tau_l則記為負(fù)樣本闲坎,如果高于\tau_h則記為正樣本。介于兩者之間的則不參與該分支的計(jì)算茬斧。 (Question:如何計(jì)算兩個(gè)track的IOU腰懂?圖森的CTRL論文,提出了一個(gè)TIoU:tracking iou)
  2. IoU regression分支:以優(yōu)化經(jīng)過GRM和PRM的track boxes和GT的iou為回歸目標(biāo)项秉。
  3. 首先绣溜,用ENC1相同結(jié)構(gòu)的編碼器來處理track box中的點(diǎn)。提取的點(diǎn)云特征通過一個(gè)簡(jiǎn)單的MLP進(jìn)行融合娄蔼,然后輸入上述兩個(gè)分支預(yù)測(cè)得分怖喻。訓(xùn)練中底哗,正負(fù)樣本采樣比為1:1 。最終的得分是兩個(gè)分支得分的幾何平均數(shù)(平方和開根號(hào))锚沸。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末跋选,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子哗蜈,更是在濱河造成了極大的恐慌前标,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,470評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件距潘,死亡現(xiàn)場(chǎng)離奇詭異炼列,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)音比,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門俭尖,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人硅确,你說我怎么就攤上這事目溉。” “怎么了菱农?”我有些...
    開封第一講書人閱讀 162,577評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵缭付,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我循未,道長(zhǎng)陷猫,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,176評(píng)論 1 292
  • 正文 為了忘掉前任的妖,我火速辦了婚禮绣檬,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘嫂粟。我一直安慰自己娇未,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,189評(píng)論 6 388
  • 文/花漫 我一把揭開白布星虹。 她就那樣靜靜地躺著零抬,像睡著了一般。 火紅的嫁衣襯著肌膚如雪宽涌。 梳的紋絲不亂的頭發(fā)上平夜,一...
    開封第一講書人閱讀 51,155評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音卸亮,去河邊找鬼忽妒。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的段直。 我是一名探鬼主播吃溅,決...
    沈念sama閱讀 40,041評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼鸯檬!你這毒婦竟也來了罕偎?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,903評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤京闰,失蹤者是張志新(化名)和其女友劉穎颜及,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蹂楣,經(jīng)...
    沈念sama閱讀 45,319評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡俏站,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,539評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了痊土。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片肄扎。...
    茶點(diǎn)故事閱讀 39,703評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖赁酝,靈堂內(nèi)的尸體忽然破棺而出犯祠,到底是詐尸還是另有隱情,我是刑警寧澤酌呆,帶...
    沈念sama閱讀 35,417評(píng)論 5 343
  • 正文 年R本政府宣布衡载,位于F島的核電站,受9級(jí)特大地震影響隙袁,放射性物質(zhì)發(fā)生泄漏痰娱。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,013評(píng)論 3 325
  • 文/蒙蒙 一菩收、第九天 我趴在偏房一處隱蔽的房頂上張望梨睁。 院中可真熱鬧,春花似錦娜饵、人聲如沸坡贺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,664評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽遍坟。三九已至,卻和暖如春褐缠,著一層夾襖步出監(jiān)牢的瞬間政鼠,已是汗流浹背风瘦。 一陣腳步聲響...
    開封第一講書人閱讀 32,818評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工队魏, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,711評(píng)論 2 368
  • 正文 我出身青樓胡桨,卻偏偏與公主長(zhǎng)得像官帘,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子昧谊,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,601評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容