視頻版:https://www.bilibili.com/video/BV15B4y1T7Q7
Mesh和參數(shù)化模型
mesh網(wǎng)格模型可以通過(guò)頂點(diǎn),
以及頂點(diǎn)按順序連接形成的面元來(lái)建立3D模型徘禁,
要生成一個(gè)人體的3D mesh髓堪,
SMPL是一種常用的參數(shù)化方法娘荡,
基于23個(gè)關(guān)節(jié)的人體模型驶沼,
輸入和比較少的85個(gè)參數(shù),
10(β體型)+72(姿態(tài))+3個(gè)參數(shù)(相機(jī))大年,
輸出6890個(gè)頂點(diǎn)玉雾,以及一萬(wàn)多個(gè)面元。
針對(duì)手部也有類似的參數(shù)化模型比如說(shuō)Mano垦缅,
許多基于深度學(xué)習(xí)的方法通過(guò)學(xué)習(xí)這些參數(shù)來(lái)估計(jì)姿態(tài)驹碍,
不過(guò)這篇今年六月份的工作沒有使用這些參數(shù),
而是直接估計(jì)了關(guān)節(jié)點(diǎn)以及mesh模型的431個(gè)頂點(diǎn)(人體)怔球,
再通過(guò)MLP上采樣到原標(biāo)準(zhǔn)的6890個(gè)頂點(diǎn)的位置浮还。
METRO掩碼頂點(diǎn)模型
paper:https://arxiv.org/pdf/2012.09760.pdf
github:https://github.com/microsoft/MeshTransformer
該方法相比之前的模型取得了相當(dāng)大的進(jìn)步,
Metro的核心思想就是尋找
各個(gè)關(guān)節(jié)以及頂點(diǎn)之間的依賴關(guān)系
這個(gè)依賴關(guān)系怎么找呢,嗯還是Transformer延刘,
啊我感覺已經(jīng)說(shuō)煩了六敬。。普泡。审编。
不了解的同學(xué)建議好好學(xué)一學(xué)attention,入股不虧砰嘁。
這里的輸入序列是23個(gè)關(guān)節(jié)和431個(gè)頂點(diǎn)斟冕,
位置編碼用的是一個(gè)人體mesh模板的3D坐標(biāo)進(jìn)行標(biāo)記缅阳。
本來(lái)的特征長(zhǎng)度是2048維的,加上這個(gè)3D坐標(biāo)就變成了2051維秀撇。
損失函數(shù)用的都是L1損失橘洞,
包括關(guān)節(jié)點(diǎn)以及頂點(diǎn)在三維空間的位置損失,
以及關(guān)節(jié)點(diǎn)投影到2D的位置損失虏等。
然后通過(guò)再通過(guò)類似BERT的掩碼語(yǔ)言模型進(jìn)行訓(xùn)練适肠,
簡(jiǎn)單點(diǎn)理解就是完形填空侯养,
作者稱之為Masked Vertex Modeling 掩碼頂點(diǎn)模型,
如果增加遮掩的頂點(diǎn)數(shù)量辩稽,表現(xiàn)可以得到提升,
當(dāng)30%的頂點(diǎn)被遮掉后差不多就飽和了患整。