Rajasegaran_Tracking_People_by_Predicting_3D_Appearance_Location_and_Pose_CVPR_2022_paper_IEEE_20...

0x00 摘要

本文分享一種僅利用單眼視頻便可識(shí)別人像的方法。主要依賴的識(shí)別方法是:預(yù)測人像在單眼視頻中未來的3D動(dòng)作查刻。
預(yù)測動(dòng)作的方法是:使用一種可靠的方法將平面的人像提升為3D,我們?yōu)槊總€(gè)識(shí)別到的人像建立了一個(gè)過去短時(shí)間內(nèi)動(dòng)作特性的模型,主要依據(jù)是3D動(dòng)作隔躲、在3D空間中所處的位置和3D外觀。

對(duì)未來的預(yù)測方面物延,我們用一種基于概率的方法在短時(shí)間內(nèi)被預(yù)測的狀態(tài)和觀察到的某一幀之間進(jìn)行計(jì)算宣旱。
(猜測,圖像間的)關(guān)聯(lián)是用匈牙利匹配算法叛薯, 匹配結(jié)果被用與按順序?qū)γ總€(gè)時(shí)隙進(jìn)行誤差修正浑吟。

0x01 簡介Intro
圖1

如同人腦對(duì)3D物體的處理,對(duì)處理系統(tǒng)的輸入都是“人眼觀察”到的RGB通道的2D像素耗溜,而呈現(xiàn)的結(jié)果卻是“對(duì)3D物體的感知”组力。當(dāng)視頻的一系列小時(shí)隙依次到來,我們先提取出從圖像中檢測到的人像的3D模型抖拴,然后以此為依據(jù)燎字,為當(dāng)前這一幀解決不同時(shí)隙間“自下而上”的檢測和“自上而下”的預(yù)測之間關(guān)聯(lián)問題。(即當(dāng)前幀前后阿宅,前面的為檢測候衍,后面的為預(yù)測,解決的是當(dāng)前幀前后的檢測和預(yù)測之間的關(guān)聯(lián)問題)

當(dāng)觀察結(jié)果與小時(shí)隙關(guān)聯(lián)起來后家夺,每個(gè)人會(huì)被重新估計(jì)脱柱,然后系統(tǒng)可以在原視頻中隨著時(shí)間的推移繼續(xù)動(dòng)態(tài)標(biāo)記出人像的位置。

能夠?qū)崿F(xiàn)這一技術(shù)的根基:深度學(xué)習(xí)和大數(shù)據(jù)拉馋,是他們讓持續(xù)的人像的3D化提取成為可能榨为,且非常可靠煌茴。
圖2:PHALP人像標(biāo)記預(yù)測系統(tǒng)
起初的提取技術(shù)基于:HMAR模型随闺。我們首先給予視頻最初的一系列幀作為輸入,在其上識(shí)別出全部人像的邊界框蔓腐。然后模型就可以輸出這些人像在3D空間中的姿勢矩乐、外觀和所處位置,通過整合最初一系列幀,就可以得到這個(gè)人像在3D空間中的動(dòng)作軌跡散罕。此后的一切工作都以這最初的一系列幀為基礎(chǔ)分歇。
接下來,以某個(gè)將來時(shí)刻的幀為依據(jù)欧漱,對(duì)全部人像在這兩個(gè)時(shí)間之間的狀態(tài)進(jìn)行預(yù)測职抡,并逐個(gè)對(duì)這些人像與那個(gè)將來時(shí)刻幀中代表人像的邊界框進(jìn)行一一對(duì)應(yīng)。(使用匈牙利算法)

使用SMPL模型中經(jīng)典的UV映射來整合人像的外觀误甚,然后使用時(shí)間距離最近的那個(gè)預(yù)測作為它的外觀缚甩;
使用經(jīng)過改進(jìn)的HMMR模型整合姿勢信息, 通過姿勢的移動(dòng)軌跡來生成姿勢的預(yù)測窑邦;
使用線性回歸來預(yù)測這個(gè)人在3D空間中未來所處的位置擅威。
在三個(gè)度量上使用匈牙利算法,可以容易的在過去檢測到的一系列小時(shí)隙人像動(dòng)作與將來一幀中的人像動(dòng)作間建立聯(lián)系冈钦。PHALP的預(yù)測可以按照時(shí)間順序繼續(xù)向下進(jìn)行預(yù)測郊丛。系統(tǒng)的最終輸出是為視頻中每個(gè)被識(shí)別的人像做出顏色框標(biāo)記,并在它們之間做出明顯區(qū)分派继。
注意宾袜,即使在有鏡頭變化(shot change)的視頻中捻艳,該系統(tǒng)依然可以識(shí)別出人像的外觀和姿勢驾窟,因?yàn)樗鼈儾粫?huì)像人物所處位置一樣會(huì)隨著鏡頭變化而改變。(在這種場景下认轨,系統(tǒng)需要一點(diǎn)點(diǎn)小的修改)

0x02 相關(guān)工作

A.(物體)追蹤
1.先前的相關(guān)工作主要集中于2D平面的追蹤绅络,在這一領(lǐng)域的工作中,作為輸入的圖像質(zhì)量是至關(guān)重要的因素嘁字。但先前工作對(duì)輸入圖像質(zhì)量的要求往往過高恩急,導(dǎo)致在3D圖像中更加難以得到利用。為了降低對(duì)輸入圖像質(zhì)量的高要求纪蜒,“倒退追蹤”是一個(gè)常用的方法衷恭,但它仍不能解決對(duì)輸入圖像質(zhì)量的要求過高這一問題。因此先前工作在3D空間對(duì)物體的運(yùn)動(dòng)軌跡纯续、動(dòng)作等進(jìn)行預(yù)測存在困難随珠,且需要引入非線性動(dòng)作模型進(jìn)行機(jī)器學(xué)習(xí)。
與之相比猬错,PHALP模型的優(yōu)勢在于窗看,只需要進(jìn)行簡單的線性回歸即可對(duì)物體在短時(shí)間內(nèi)的3D坐標(biāo)進(jìn)行預(yù)測。
2.目前也有在追蹤方面整合3D信息的方法倦炒,但它們大都需要多角度的圖像輸入显沈,或要求3D激光掃描作為輸入。而PHALP只要求單眼(2D)圖像輸入。
3.最近的工作利用物體不變性來追蹤視頻輸入中固定的人群拉讯,需要依賴深度評(píng)估網(wǎng)絡(luò)來確定人群的3D位置涤浇。另外一些方法需要借助人工標(biāo)注數(shù)據(jù)序列來學(xué)習(xí)不變性。而在PHALP中魔慷,已經(jīng)通過在3D空間中放置完整的人體網(wǎng)格實(shí)現(xiàn)了對(duì)人像所處位置芙代、姿勢和外觀的預(yù)測。換言之盖彭,物體不變性已經(jīng)內(nèi)建在PHALP系統(tǒng)中了纹烹。

B.從單眼圖像3D人體重建
我們主要依托HMAR的一個(gè)改進(jìn)版本,使用了一個(gè)與HMMR類似的模型來實(shí)現(xiàn)單眼3D人體重建

0x03 方法

PHALP主要具有三個(gè)步驟:
1.為檢測到的每個(gè)人像都進(jìn)行分析召边;
2.對(duì)過去一段時(shí)間的人像(軌跡)進(jìn)行整合铺呵,并生成對(duì)未來狀態(tài)(軌跡)的預(yù)測;
3.在基于概率的框架中隧熙,將已分析的(過去的)小時(shí)隙中的人像(軌跡)與預(yù)測(軌跡)結(jié)果進(jìn)行關(guān)聯(lián)片挂。

A. 單幀處理過程
我們使用HMAR模型的一個(gè)改進(jìn)版本進(jìn)行該步驟的工作。PHALP系統(tǒng)的單幀輸入將使用例如Mask-RCNN的傳統(tǒng)檢測網(wǎng)絡(luò)進(jìn)行分析贞盯,并計(jì)算識(shí)別人像的三個(gè)基本度量:姿勢音念、外觀和在空間中所處的位置。HMAR會(huì)返回這三個(gè)度量的值:
3D姿勢 p躏敢;外觀 a闷愤; 人像在3D空間中的位置的估計(jì)l
HMAR的輸入是邊界框內(nèi)的像素,當(dāng)人群非常密集時(shí)件余,這些像素可能不完全來自一個(gè)人讥脐。這樣可能會(huì)引起結(jié)果的誤差。解決方法:對(duì)HMAR模型進(jìn)行改進(jìn)啼器,為其增加一個(gè)新的輸入?yún)?shù)旬渠。用來自Mask R-CNN輸出的,關(guān)于人像識(shí)別的像素級(jí)別蒙版端壳,對(duì)HMAR進(jìn)行重訓(xùn)練告丢。作者認(rèn)為這樣的處理并不能保證完全消除誤差,也不能保證識(shí)別框和識(shí)別像素的完全正確损谦,但能夠在處理人群密集視頻的時(shí)候有改善岖免,擁有更強(qiáng)的魯棒性。

B.3D 小時(shí)隙預(yù)測
目前的3D分析可以為每一幀畫面都生成人像明顯而生動(dòng)的人像模型成翩,并將其描繪出來觅捆。利用這些信息,在我們的追蹤算法中可以在每一步的online處理之后都創(chuàng)建人像模型麻敌,并對(duì)每個(gè)小時(shí)隙之后的人像狀態(tài)進(jìn)行預(yù)測栅炒。
1.外觀預(yù)測算法
外觀預(yù)測算法可以在多個(gè)連續(xù)時(shí)隙中捕捉每一個(gè)獨(dú)立的人,并整合出這個(gè)人的外觀信息。人像在視頻中經(jīng)常被遮擋赢赊,便于描繪人像的狀態(tài)乙漓,故創(chuàng)建蒙板V,并與從單幀圖像中得到的人像UV圖進(jìn)行結(jié)合释移,即可體現(xiàn)這種遮擋關(guān)系叭披。用A代表某個(gè)人i在時(shí)間t的外觀,這個(gè)外觀是由這個(gè)人的UV圖像T和可見性蒙板V結(jié)合而成的玩讳。這一步是用HMAR模型完成的涩蜘。蒙板為二值化取值(0,1)熏纯,表示UV上的某個(gè)點(diǎn)是否可見同诫。
取某個(gè)人在全體時(shí)間中A的外觀集合Ai,進(jìn)行聚合算法如下:
(公式2)
該聚合值為單幀外觀的加權(quán)和值樟澜,將舊有的Ait和最新一幀進(jìn)行加權(quán)求和误窖。注意,當(dāng)只有最初單幀時(shí)秩贰,該加權(quán)和的值與那一幀的外觀值相等霹俺。該公式可以表現(xiàn)出人像外觀逐幀的細(xì)微變化。最后毒费,將該算法得到的人像外觀模型預(yù)測與實(shí)際得到的輸入進(jìn)行對(duì)比丙唧,即可得到預(yù)測質(zhì)量的評(píng)估。
圖三展示了這一過程蝗罗。
2.位置預(yù)測算法
為了避免在進(jìn)行人像空間位置預(yù)測時(shí)出現(xiàn)不穩(wěn)定艇棕,作者放棄使用XYZ軸,而是將Z軸轉(zhuǎn)換為畫面深度N進(jìn)行運(yùn)算:n = log(1/z)串塑。其中,X北苟、Y表示人像在平面圖像中的位置桩匪,而N表示人像在平面圖像中的深度。利用畫面深度值N友鼻,可以很直接地用該值表示人像在觀看者眼中的規(guī)模大小傻昙。即:深度代表人像在觀看者眼中,與觀看者距離的遠(yuǎn)近彩扔,越遠(yuǎn)則人像規(guī)模越小妆档,反之則越大。
常用的Constant Velocity Assumption (CVA)常速假設(shè)對(duì)XYN進(jìn)行線性回歸:
與外觀模型類似虫碉,將舊有的一系列過去位置集合Li(Lit=(xit贾惦,yit,nit)T)作為輸入,進(jìn)行位置預(yù)測须板。
位置預(yù)測算法如下:
(公式3)
輸出的預(yù)測結(jié)果的每個(gè)分量是在各自坐標(biāo)軸的線性回歸碰镜,各坐標(biāo)軸上的計(jì)算完全類似,沒有特殊處理习瑰。
在對(duì)每個(gè)分量進(jìn)行線性回歸時(shí)绪颖,取值的間隔計(jì)算方法如下,以X為例:
(公式4)
其中甜奄,α是由自由度的值(w-2)得到的置信分布柠横。MSE的值為預(yù)測人像位置上誤差的平方的均值】涡郑ˉt是舊有幀的時(shí)間的平均值滓鸠。
3.姿勢預(yù)測算法
姿勢預(yù)測算法以舊有的一系列姿勢Pi作為輸入,計(jì)算生成人像姿勢的預(yù)測pbt第喳。與前二者:外觀預(yù)測和位置預(yù)測不同糜俗,由于姿勢變化較為細(xì)微,姿勢預(yù)測算法需要接下來的最多12幀作為依據(jù)對(duì)人像姿勢進(jìn)行回歸曲饱。作者使用HMMR模型進(jìn)行算法的運(yùn)算悠抹。
(這里的HMMR基于Transformer進(jìn)行調(diào)整過的,Transformer是基于自注意力機(jī)制的一個(gè)深度學(xué)習(xí)模型)
Transformer科普:https://zhuanlan.zhihu.com/p/82312421
使用該模型的優(yōu)勢是:輸入中的人像可以是不連續(xù)的扩淀,且即使輸入不連續(xù)楔敌,也依然可以對(duì)接下來時(shí)隙幀的人像姿勢進(jìn)行預(yù)測,如圖4
(圖4)

C.對(duì)預(yù)測得到的3D人像進(jìn)行追蹤
使用與上述類似的算法得到預(yù)測人像驻谆。在每個(gè)時(shí)隙卵凑,每個(gè)人像都具有外觀、位置和姿勢三種屬性胜臊,每種屬性都有不同的特性勺卢。即:每種屬性的預(yù)測準(zhǔn)確率在數(shù)學(xué)分布上的特性都不同,具體見圖5.
(圖5)
通過舊有的一系列幀象对,可以計(jì)算得出預(yù)測的下一幀T的人像模型屬性黑忱。這些屬性都在人像的UV像素空間中。接下來勒魔,作者使用HMAR人像編碼器網(wǎng)絡(luò)甫煞,將預(yù)測的人像模型與實(shí)際的下一幀中識(shí)別的人像模型進(jìn)行擬合,并計(jì)算得出三種屬性的誤差?冠绢。
1.外觀誤差
(公式)
基于貝葉斯公式抚吠,后驗(yàn)概率與外觀誤差?A的條件概率是成比例的〉苷停基于圖5中左上圖像的“外觀距離”楷力,使用柯西分布對(duì)外觀誤差進(jìn)行建模喊式,可以得到近似分布概率:
(公式5)
該分布公式中有一個(gè)比例調(diào)優(yōu)參數(shù)βa,需要人工調(diào)優(yōu)弥雹。
2.姿勢誤差
(公式)
與外觀誤差類似垃帅,作者使用柯西分布對(duì)人像內(nèi)圍的條件概率進(jìn)行擬合。 如上方公式剪勿,?p同樣基于模型姿勢預(yù)測值和下一幀的檢測值進(jìn)行計(jì)算贸诚。可以得到與外觀誤差類似的近似分布概率:
(公式6)
該分布公式中厕吉,?p和βp都是比例系數(shù)酱固。
3.位置誤差
對(duì)位置誤差的擬合與外觀和姿勢不同,且最終擬合的分布曲線也不同头朱。這里需要對(duì)下一幀的預(yù)測位置Li运悲,檢測到的位置Lt和三維屬性的預(yù)測向量{δx, δy, δn}作為輸入,在后一幀中計(jì)算考慮位置誤差的小時(shí)隙的后驗(yàn)概率项钮。作者根據(jù)經(jīng)驗(yàn)數(shù)據(jù)班眯,將這個(gè)條件概率分布近似擬合為指數(shù)分布。圖5下方的兩圖展示了由不同坐標(biāo)軸的置信區(qū)間擬合的圖像烁巫,其內(nèi)圍近似為指數(shù)分布署隘,左一表示X、Y平面亚隙,右一表示圖像深度這一維度磁餐。
其中,內(nèi)圍(藍(lán)色部分)表示預(yù)測正確阿弃,擬合曲線外部(橙色部分)表示預(yù)測錯(cuò)誤诊霹。
X、Y平面內(nèi)圍的后驗(yàn)概率表達(dá)式如下:
(公式7)
其中βxy是指數(shù)分布的比例系數(shù)渣淳,?xy 是預(yù)測人像狀態(tài)和實(shí)際下一幀人像狀態(tài)的2D像素誤差脾还,δxy是2D位置預(yù)測的置信區(qū)間。
圖像深度內(nèi)圍的后驗(yàn)概率表達(dá)式如下:
(公式8)
其中βn是指數(shù)分布的比例系數(shù)水由,δn是圖像深度的置信區(qū)間荠呐,?n是預(yù)測人像狀態(tài)和實(shí)際下一幀人像狀態(tài)的畫面深度誤差。
由于實(shí)際人像的條件概率由于外觀砂客、姿勢和位置三個(gè)屬性描述,其中位置屬性又由X呵恢、Y鞠值、N三個(gè)維度描述,故某幀中實(shí)際人像的總體條件概率可以由這五個(gè)屬性進(jìn)行計(jì)算:
(公式9)
這個(gè)總體條件概率可以描述這五個(gè)屬性的誤差之間的關(guān)聯(lián)渗钉。為了描述這些關(guān)聯(lián)彤恶,作者將相似度度量映射到權(quán)重值上钞钙。預(yù)測人像與實(shí)際人像之間的權(quán)重函數(shù)如下,由這五個(gè)屬性的誤差作為輸入:
(公式10)
最終使用匈牙利算法進(jìn)行預(yù)測狀態(tài)與實(shí)際圖像狀態(tài)進(jìn)行匹配声离。作者使用損失函數(shù)對(duì)權(quán)重函數(shù)的參數(shù)進(jìn)行調(diào)優(yōu)芒炼。參數(shù)的初始值來自估計(jì)密度函數(shù),而損失函數(shù)是幀之間的關(guān)聯(lián)誤差术徊。調(diào)優(yōu)算法是內(nèi)德-米德算法本刽。調(diào)優(yōu)完畢的參數(shù)值將被用于PHALP追蹤算法實(shí)際應(yīng)用測試。PHALP追蹤算法如下:
(算法1)
PHALP追蹤算法可以簡單概括如下:
1.輸入:作為輸入的視頻材料的每一幀的圖像赠涮,及其時(shí)間戳t子寓,并為分析過程設(shè)定每一幀的“壽命”,當(dāng)同一幀未能匹配成功的次數(shù)超過其壽命時(shí)笋除,表明它的特征已經(jīng)被納入輸出的結(jié)果斜友,需要從幀集合中移除;
2.為每一幀圖像中識(shí)別的全部人像計(jì)算分析所用的五個(gè)屬性的預(yù)測值垃它,即人像鲜屏、姿勢,和位置信息中的橫軸坐標(biāo)国拇、縱軸坐標(biāo)洛史、深度信息。該步驟相當(dāng)于為下一幀的人像屬性信息作預(yù)測贝奇;
3.為接下來的每一幀計(jì)算預(yù)測屬性值和實(shí)際值虹菲,并用權(quán)重函數(shù)的方法計(jì)算兩者間的權(quán)重,用以描述它們的關(guān)聯(lián)程度掉瞳;
4.根據(jù)權(quán)重函數(shù)的計(jì)算結(jié)果毕源,使用匈牙利算法對(duì)每一幀的下一幀的預(yù)測狀態(tài)和實(shí)際圖像狀態(tài)進(jìn)行匹配;
5.將那些預(yù)測與實(shí)際足夠近似而匹配成功的幀置入輸入結(jié)果的集合陕习;
6.將那些匹配失敗的幀壽命+1霎褐;
7.用那些多次匹配失敗的幀重新組成輸入幀集合,便于下個(gè)循環(huán)繼續(xù)分析之该镣,直到所有失敗幀的壽命均已耗盡冻璃;
8.將已超過“壽命”的幀丟棄,因?yàn)檫@些預(yù)測結(jié)果與實(shí)際圖像的差距過大损合,算法不得不將其舍棄省艳。

0x04 實(shí)驗(yàn)

實(shí)驗(yàn)使用的數(shù)據(jù)集有三:姿勢追蹤、MuPoTS和AVA嫁审,畫面內(nèi)容囊括體育運(yùn)動(dòng)跋炕、日常閑聊和電影。所依賴的學(xué)習(xí)模型為Mask-RCNN律适。評(píng)估度量有三:人像身份轉(zhuǎn)換辐烂、多物體追蹤的準(zhǔn)確率和ID F1分?jǐn)?shù)(IDF1指標(biāo)代表被檢測和跟蹤的目標(biāo)中獲取正確的ID的檢測目標(biāo)的比例遏插,綜合考慮ID準(zhǔn)確率和ID召回率,代表兩者的調(diào)和均值纠修。
公式
其中胳嘲,IDP代表ID跟蹤的準(zhǔn)確率,IDR代表ID跟蹤的召回率扣草。IDF1指標(biāo)更聚焦于跟蹤算法跟蹤某個(gè)目標(biāo)的時(shí)間長短了牛,考察跟蹤的連續(xù)性和重識(shí)別的準(zhǔn)確性。IDF1以1為最佳情況德召,數(shù)值越高代表跟蹤特定目標(biāo)的精度越好白魂。)
(表1)
與其他多目標(biāo)追蹤方法對(duì)比,PHALP追蹤算法的綜合表現(xiàn)性能更優(yōu)上岗。
(表2)

0x05 個(gè)人對(duì)算法的認(rèn)識(shí)及分析

宏觀來講福荸,PHALP算法是利用基礎(chǔ)的二維圖像框進(jìn)行人物識(shí)別的基礎(chǔ)技術(shù),結(jié)合自己設(shè)計(jì)的外觀肴掷、姿勢敬锐、位置三大屬性來描繪單個(gè)人物在圖像中的狀態(tài),并以此為依據(jù)呆瞻,得到了單個(gè)人物的UV建模台夺,并將其在二維平面中“提取”出來,得到了三維的結(jié)果痴脾。由于PHALP算法的輸入是視頻租冠,所以不能僅僅停留在單幀畫面的分析艘儒,而是必須能夠在連續(xù)的視頻中持續(xù)追蹤到同一個(gè)人物怪得。這一步的核心工作是基于HMAR和HMMR框架的機(jī)器學(xué)習(xí)通砍,根據(jù)已有部分視頻的多幀輸入和將來的一幀或多幀,通過訓(xùn)練來對(duì)缺少的這些幀的人物狀態(tài)進(jìn)行“預(yù)測”前域。這個(gè)“預(yù)測”本質(zhì)上是通過對(duì)三大屬性的計(jì)算辕近,結(jié)合經(jīng)驗(yàn)數(shù)據(jù)的概率分布曲線,選擇合理的置信區(qū)間進(jìn)行推測匿垄。上述工作對(duì)整個(gè)輸入視頻的每一幀都將執(zhí)行移宅,并在最終使用匈牙利算法將這些預(yù)測結(jié)果和實(shí)際視頻圖像中的人像狀態(tài)進(jìn)行匹配,匹配的依據(jù)是它們的相似程度椿疗。相似程度使用調(diào)優(yōu)的權(quán)重函數(shù)和損失函數(shù)進(jìn)行描述漏峰。在多次預(yù)測并匹配篩選后,可以得到有參考依據(jù)的人像UV模型輸出届榄。由于每一幀都得到了輸出結(jié)果芽狗,輸出的人像UV模型可以在視頻中被連續(xù)的標(biāo)記出來,在人眼中呈現(xiàn)出連續(xù)的痒蓬、運(yùn)動(dòng)的3D模型童擎。
另外,由于核心工作是基于計(jì)算預(yù)測的攻晒,通過PHALP算法追蹤到的人像即使短暫被其他人或物體遮擋顾复,也可以繼續(xù)追蹤。
對(duì)于視頻圖像中人物數(shù)量過多或重疊程度過高的問題鲁捏,作者是基于經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行優(yōu)化的芯砸。

0x06 Futrue Working

1.在外觀預(yù)測算法(Chap 3 B Formula 2)中,作者對(duì)相鄰時(shí)隙間的人像外觀做了樂觀假設(shè)给梅,假設(shè)外觀一般不會(huì)出現(xiàn)大幅度的變化假丧。這一點(diǎn)在一些極端情況中并不適用,如交通事故視頻动羽。個(gè)人認(rèn)為在這些極端情況下包帚,這一技術(shù)的應(yīng)用效果將大打折扣。
2.對(duì)于視頻圖像中人物數(shù)量過多或重疊程度過高的問題运吓,由于作者基于經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行優(yōu)化渴邦,盡管在文中提到這是“已經(jīng)盡力的優(yōu)化”,這樣處理的有效程度很可能隨著輸入視頻中人物數(shù)量和重疊程度的高低顯著變化拘哨。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末谋梭,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子倦青,更是在濱河造成了極大的恐慌瓮床,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,482評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件产镐,死亡現(xiàn)場離奇詭異隘庄,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)磷账,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,377評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門峭沦,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人逃糟,你說我怎么就攤上這事吼鱼。” “怎么了绰咽?”我有些...
    開封第一講書人閱讀 152,762評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵菇肃,是天一觀的道長。 經(jīng)常有香客問我取募,道長琐谤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,273評(píng)論 1 279
  • 正文 為了忘掉前任玩敏,我火速辦了婚禮斗忌,結(jié)果婚禮上质礼,老公的妹妹穿的比我還像新娘。我一直安慰自己织阳,他們只是感情好眶蕉,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,289評(píng)論 5 373
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著唧躲,像睡著了一般造挽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上弄痹,一...
    開封第一講書人閱讀 49,046評(píng)論 1 285
  • 那天饭入,我揣著相機(jī)與錄音,去河邊找鬼肛真。 笑死谐丢,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的毁欣。 我是一名探鬼主播庇谆,決...
    沈念sama閱讀 38,351評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼凭疮!你這毒婦竟也來了饭耳?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,988評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤执解,失蹤者是張志新(化名)和其女友劉穎寞肖,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體衰腌,經(jīng)...
    沈念sama閱讀 43,476評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡新蟆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,948評(píng)論 2 324
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了右蕊。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片琼稻。...
    茶點(diǎn)故事閱讀 38,064評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖饶囚,靈堂內(nèi)的尸體忽然破棺而出帕翻,到底是詐尸還是另有隱情,我是刑警寧澤萝风,帶...
    沈念sama閱讀 33,712評(píng)論 4 323
  • 正文 年R本政府宣布嘀掸,位于F島的核電站,受9級(jí)特大地震影響规惰,放射性物質(zhì)發(fā)生泄漏睬塌。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,261評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望揩晴。 院中可真熱鬧勋陪,春花似錦、人聲如沸文狱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,264評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽瞄崇。三九已至,卻和暖如春壕曼,著一層夾襖步出監(jiān)牢的瞬間苏研,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,486評(píng)論 1 262
  • 我被黑心中介騙來泰國打工腮郊, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留摹蘑,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,511評(píng)論 2 354
  • 正文 我出身青樓轧飞,卻偏偏與公主長得像衅鹿,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子过咬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,802評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容