模板匹配綜述-SSD祥诽,BBS譬圣,DDIS,CoTM雄坪,QATM

簡(jiǎn)單看了幾篇模板匹配相關(guān)的論文厘熟,總結(jié)了一下,后期待修改

模板匹配介紹

模板匹配是計(jì)算機(jī)視覺(jué)應(yīng)用中最常用的技術(shù)之一维哈,可以應(yīng)用在視頻跟蹤绳姨,圖像拼接,目標(biāo)檢測(cè)笨农,字符識(shí)別和3D重建等方向上就缆。
模板和目標(biāo)圖像的子窗口之間的相似性度量是模板匹配的核心部分。

傳統(tǒng)的模板匹配相似性度量

傳統(tǒng)的模板匹配方法通常使用平方差和(SSD谒亦,sum-of-squared-differences)或歸一化積相關(guān)(NCC竭宰,normalized cross-correlation)等來(lái)計(jì)算模板與基礎(chǔ)圖像之間的相似度得分。
在搜索圖S中份招,以(i,j)為左上角切揭,取MxN大小的子圖,計(jì)算其與模板的相似度锁摔;遍歷整個(gè)搜索圖廓旬,在所有能夠取到的子圖中,找到與模板圖最相似的子圖作為最終匹配結(jié)果谐腰。

SSD

平方差和孕豹,數(shù)值越大相似度越小。

NCC

利用子圖與模板圖的灰度十气,通過(guò)歸一化的相關(guān)性度量公式來(lái)計(jì)算二者之間的匹配程度励背。

傳統(tǒng)算法評(píng)價(jià):

優(yōu)點(diǎn):

①思路簡(jiǎn)單,容易理解砸西。②運(yùn)算過(guò)程簡(jiǎn)單叶眉,匹配精度高。

缺點(diǎn):

①運(yùn)算量偏大芹枷。②對(duì)噪聲非常敏感衅疙。

總結(jié):

當(dāng)模板和目標(biāo)搜索圖像之間的轉(zhuǎn)換很簡(jiǎn)單時(shí),這些方法效果很好鸳慈。但是饱溢,當(dāng)轉(zhuǎn)換復(fù)雜或非剛性時(shí)(stretching or shrinking),這些方法的成功率會(huì)大幅下降走芋。 另外理朋,其他因素(例如遮擋和顏色偏移)也會(huì)對(duì)這些方法造成很大影響絮识。
并且,這種方法測(cè)量相似性時(shí)考慮模板和目標(biāo)圖像中的候選窗口中的所有像素(特征點(diǎn))嗽上。當(dāng)目標(biāo)背后的背景改變時(shí)次舌,這種方法是不可取的。

BBS(Best-Buddies-Similarity)

Introduction

CVPR2015 論文地址

本質(zhì)是Best-Buddies Similarity(BBS算法)兽愤。這是一種在兩個(gè)點(diǎn)集之間的無(wú)參魯棒相似性測(cè)量彼念,核心是計(jì)算Best-Buddies Pairs(BBPs)的數(shù)量。

Method

用傳統(tǒng)的滑動(dòng)窗口方法浅萧,在模板和圖像中每個(gè)可能的窗口(模板大兄鹕场)之間同樣計(jì)算出BBS。

BBS

首先需要將每個(gè)圖像塊轉(zhuǎn)換為\mathbb{R}^3phgkjg中的一個(gè)點(diǎn)集洼畅。為此吩案,把圖像分成若干個(gè)的k x k圖像塊。每個(gè)圖像塊由其RGB值組成的k^{2}個(gè)矢量和中心像素相對(duì)于坐標(biāo)系的xy坐標(biāo)表示帝簇。

BBS測(cè)量了兩個(gè)點(diǎn)集P和Q之間的相似性徘郭,當(dāng)p_{i}q_{j}互為最近鄰時(shí),他們?yōu)橐唤MBBP(原集和目標(biāo)集中的點(diǎn)對(duì)丧肴,每個(gè)點(diǎn)都是另一個(gè)點(diǎn)的最近鄰)残揉。

點(diǎn)集P和點(diǎn)集Q之間的BBS定義為:(d()為距離函數(shù))
上標(biāo)A表示像素外觀(例如RGB),上標(biāo)L表示像素位置(標(biāo)準(zhǔn)化為[0芋浮,1]的色塊內(nèi)的x抱环,y),λ= 2

BBS隨兩點(diǎn)集的分布區(qū)別增大而減小纸巷,兩個(gè)分布相同時(shí)取得最大值镇草。如果兩個(gè)點(diǎn)是BBP,它們很可能是從相同的分布中提取的瘤旨。
BBS的主要特性為

  • 只依賴于匹配點(diǎn)(BBPs)的子集(通常很刑萜 ),其余的被視為外點(diǎn)裆站,對(duì)于大部分異常點(diǎn)具有魯棒性
  • BBS可以找出數(shù)據(jù)中的雙向匹配點(diǎn)而不需要任何先驗(yàn)知識(shí)或者潛在變形
  • BBP通過(guò)計(jì)算BBP的數(shù)量進(jìn)行排名,而不是使用實(shí)際的距離值

CONCLUSION

在存在高水平的異常值(即背景噪聲黔夭、遮擋)和目標(biāo)的非剛性變形的情況下宏胯,將模板與給定圖像匹配”纠眩可以抵抗復(fù)雜的幾何變形和高度異常的點(diǎn)(背景噪聲和遮擋)肩袍。
BBS可以在存在異常值的情況下可靠地匹配來(lái)自同一分布的特征,在視角變換和集合變形下依然可以進(jìn)行穩(wěn)健的模板匹配婚惫。
缺點(diǎn)是當(dāng)模板與目標(biāo)圖像相比很小時(shí)氛赐,或者離群值(遮擋對(duì)象或背景雜波)覆蓋了大多數(shù)模板時(shí)魂爪,成功率會(huì)降低。

DDIS (Deformable Diversity Similarity)

Introduction

——CVPR2017 論文地址

DDIS明確考慮了可能的模板變形艰管,并使用了模板和搜索圖像中潛在匹配區(qū)域之間的NN特征匹配的多樣性滓侍。

采用了基于特征的BBS無(wú)參數(shù)方法∩螅基于目標(biāo)圖像窗口和模板之間特征匹配的多樣性撩笆,它對(duì)復(fù)雜的變形,明顯的背景雜波和遮擋具有魯棒性缸浦。

Method

Diversity

我們的關(guān)鍵思想是通過(guò)最近鄰域(NN field)的兩個(gè)屬性來(lái)得到目標(biāo)和模板之間的相似性夕冲。

首先,如圖2d所示裂逐,當(dāng)目標(biāo)和模板對(duì)應(yīng)時(shí)歹鱼,大多數(shù)目標(biāo)patch在模板中具有唯一的NN匹配。這意味著最近鄰域高度多樣化卜高,指向模板中的許多不同的patch弥姻。

相反,如圖2e所示篙悯,對(duì)于任意目標(biāo)蚁阳,大多數(shù)patch都沒(méi)有很好的匹配,并且NN收斂到恰好與目標(biāo)patch相似的少量模板點(diǎn)鸽照。第二螺捐,不佳匹配往往意味著較大的變形,如圖2e中的長(zhǎng)箭頭所示矮燎。


DIS & BBP


對(duì)每個(gè)q定血,都有一條紅箭頭指向它的NN p,如果p q為BBP诞外,將兩點(diǎn)之間的紅箭頭改為綠線澜沟。
DIS計(jì)算由紅色箭頭或綠線指向的藍(lán)色三角形數(shù)量。BBS計(jì)算綠線數(shù)量峡谊。
(a)P和Q的分布相似茫虽,因此,許多p是某些q的NN既们,并且有很多BBP濒析。這里DIS = BBS =8。
(b)P和Q具有不同的分布啥纸。密集p中的單個(gè)q或密集q中的單個(gè)p對(duì)DIS和BBS均貢獻(xiàn)1号杏。有時(shí),Q和P之間存在唯一的NN匹配斯棒,而不是BBP盾致。由于P和Q的分布不同主经,DIS和BBS都相對(duì)較低,因此DIS = 3和BBS = 2庭惜。

DDIS

為了整合對(duì)大變形的懲罰罩驻,對(duì)DIS進(jìn)行了兩種修改:
首先,為了獲得變形場(chǎng)的顯式表示蜈块,區(qū)分每個(gè)patch的外觀和位置并將它們分別對(duì)待鉴腻。
其次,提出了另一種測(cè)量多樣性的方法百揭,該方法可以考慮變形量爽哎。
p^a表示外觀,而p^l表示patch p的位置(q同理)器一。我們?yōu)槊總€(gè)點(diǎn)q_j尋找基于appearance的NN^a p_i(d為距離函數(shù))


和它的的location距離由表示

定義作為為的patch q的數(shù)量课锌,

定義DDIS:其中歸一化因子c = 1 / min {M,N}

該定義可以看作是點(diǎn)上的contribution之和祈秕。 每個(gè)點(diǎn)的貢獻(xiàn)由其隱含變形矢量的長(zhǎng)度反向加權(quán)渺贤。

當(dāng)點(diǎn)q_j具有唯一的NN時(shí),則κ(NN^a(q_j请毛,P))= 1志鞍,指數(shù)達(dá)到最大值1。
當(dāng)q_j的NN被許多其他點(diǎn)共享時(shí)方仿,則κ(NN^a(q_j固棚,P))大,指數(shù)值低仙蚜,并且q_j對(duì)相似度的總體貢獻(xiàn)低此洲。

DDIS具有使其具有吸引力的幾個(gè)屬性:
(1)它主要依賴于具有不同NN的點(diǎn)。 共享NN的點(diǎn)的分?jǐn)?shù)對(duì)分?jǐn)?shù)的影響較小委粉。
(2)DDIS不需要任何有關(guān)數(shù)據(jù)或其潛在變形的先驗(yàn)知識(shí)呜师。
(3)DDIS分析NN field,而不是使用實(shí)際距離值贾节。

CONCLUSION

DDIS與BBS極為相似汁汗,他們都依賴于兩組點(diǎn)之間的NN匹配。 但是有兩個(gè)主要區(qū)別:
(i)兩組之間相似性的測(cè)量方式 →(i)計(jì)算復(fù)雜度降低栗涂,運(yùn)行時(shí)間縮短
(ii)空間變形量的計(jì)算知牌。→(ii)檢測(cè)精度更高

而DDIS對(duì)外觀和位置之間的分隔也可以使模板定位更加準(zhǔn)確戴差。具有非常相似外觀的目標(biāo)窗口重疊可能導(dǎo)致非常相似的得分送爸。 DDIS選擇隱含變形較少的窗口铛嘱,可以提高定位精度暖释。

DDIS可以克服諸如背景雜波袭厂,遮擋和非剛性變形等。缺點(diǎn)是不能處理物體的明顯尺度變化球匕。

CoTM (Co-occurrence based template matching)

Introduction

CVPR2018 論文地址

CoTM提出了一種基于共現(xiàn)統(tǒng)計(jì)(co-occurrence statistics)來(lái)匹配像素的新度量纹磺,以量化模板和搜索圖像中潛在匹配區(qū)域之間的差異,在整個(gè)圖像平面上收集共現(xiàn)統(tǒng)計(jì)信息亮曹,測(cè)量一對(duì)像素值在小窗口內(nèi)共現(xiàn)的概率橄杨。該度量依賴于一個(gè)共現(xiàn)矩陣(co-occurrence matrix),該矩陣對(duì)一個(gè)窗口內(nèi)某個(gè)像素值對(duì)共同出現(xiàn)的次數(shù)進(jìn)行計(jì)數(shù)照卦。

共現(xiàn)統(tǒng)計(jì)與前面提到的基于補(bǔ)丁的表示形式不同式矫。基于補(bǔ)丁的方法收集本地統(tǒng)計(jì)信息役耕,而共現(xiàn)方法則收集全局統(tǒng)計(jì)信息采转。圖像中經(jīng)常出現(xiàn)的像素值可能是紋理區(qū)域的一部分,因此就隱式捕獲了紋理相似性的一些概念瞬痘。CoTM與實(shí)際像素值無(wú)關(guān)故慈,僅與它們的共現(xiàn)統(tǒng)計(jì)有關(guān)。

Method

基于SSD的模板匹配最小化∑_p(T_p-R_p)^2框全,其中察绷,T是模板,R是圖像I中與T大小相同的區(qū)域津辩,p是像素位置拆撼。

而CoTM最大化∑_p M(T_p,R_p),其中M是從圖像數(shù)據(jù)中學(xué)習(xí)的(規(guī)范化)共現(xiàn)矩陣丹泉,可以使用它來(lái)給出將像素值T_p與像素值 R_p匹配的cost情萤。

對(duì)于多通道圖像(即彩色或深層特征),我們使用k-means將圖像量化為固定數(shù)量的k簇摹恨。

Co-occurrence Matrix

共現(xiàn)矩陣C(a筋岛,b)對(duì)兩個(gè)像素值a和b一起出現(xiàn)在圖像中的次數(shù)進(jìn)行計(jì)數(shù)。值為其在像平面中的距離晒哄。

其中p和q是像素位置睁宰,I_p是圖像I中像素p的值,Z是歸一化因子寝凌。 σ是用戶指定的參數(shù)(僅考慮與σ成比例的窗口內(nèi)的像素)柒傻,如果括號(hào)內(nèi)的值為true,則[·]等于1较木,否則為0红符。

為了保留圖像中很少出現(xiàn)的像素值,將C除以它們的先驗(yàn)概率,以獲得點(diǎn)向互信息(Pointwise Mutual Information PMI)矩陣:



其中h(a)是圖像中像素值a出現(xiàn)的概率预侯。


共現(xiàn)統(tǒng)計(jì):(左)查詢圖像致开。 (右)PMI矩陣M。(亮色為低分萎馅,深色為高分双戳。)

M(A):棕色和藍(lán)色很少同時(shí)出現(xiàn),PMI較低糜芳。
M(B):橙色和白色同時(shí)出現(xiàn)飒货,PMI高。

M(C):淺綠色和深綠色峭竣, 即使頻繁共現(xiàn)塘辅,PMI值也很低,因?yàn)樗麄兊南闰?yàn)概率很高皆撩。

將具有不同大小的兩個(gè)模板匹配到同一張圖像莫辨,僅屬于對(duì)象的像素具有較高的權(quán)重,并且匹配結(jié)果幾乎相同毅访。
背景影響:(c)每像素分?jǐn)?shù)M(Tp沮榜,Qp)。添加更多背景像素并不會(huì)明顯改變整體得分喻粹。

Algorithm

CONCLUSION

CoTM對(duì)失準(zhǔn)和變形(misalignment and deformations)具有魯棒性蟆融,可以快速計(jì)算,并且可以處理不同的像素值守呜,例如RGB顏色或深色特征型酥。
但CoTM受到許多限制:

  • 首先,灰色像素值的共現(xiàn)效果不好查乒。
  • 其次弥喉,當(dāng)模板的像素值頻繁出現(xiàn)在背景中時(shí),性能會(huì)下降玛迄。(在這種情況下由境,背景像素不會(huì)降低權(quán)重。)
  • 最后蓖议,尚未解決照明方面的變化虏杰,


    Ground-truth:綠色框,顏色特征搜索:黃色框勒虾,深層特征搜索:紅色框

CONCLUSION

以上三種方法:

  • BBS纺阔,側(cè)重于nearest-neighbor(NN)匹配,以排除由背景像素引起的潛在和不良匹配修然。
  • DDIS笛钝,考慮了可能的模板變形质况,使用了模板和搜索圖像中潛在匹配區(qū)域之間的NN特征匹配的多樣性度量。
  • CoTM玻靡,量化模板和搜索圖像中潛在匹配區(qū)域之間的差異拯杠。

這些方法確實(shí)提高了模板匹配的性能。但是啃奴,由于兩個(gè)局限性,這些方法無(wú)法用于深度神經(jīng)網(wǎng)絡(luò)(DNN)中:

  1. 使用不可微分的運(yùn)算(例如閾值雄妥,計(jì)數(shù)等)
  2. 使用對(duì)DNN無(wú)效的運(yùn)算最蕾,例如作為循環(huán)和其他非批處理操作。

QATM

QATM

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末老厌,一起剝皮案震驚了整個(gè)濱河市瘟则,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌枝秤,老刑警劉巖醋拧,帶你破解...
    沈念sama閱讀 219,039評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異淀弹,居然都是意外死亡丹壕,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門薇溃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)菌赖,“玉大人,你說(shuō)我怎么就攤上這事沐序×鹩茫” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 165,417評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵策幼,是天一觀的道長(zhǎng)邑时。 經(jīng)常有香客問(wèn)我,道長(zhǎng)特姐,這世上最難降的妖魔是什么晶丘? 我笑而不...
    開(kāi)封第一講書人閱讀 58,868評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮唐含,結(jié)果婚禮上铣口,老公的妹妹穿的比我還像新娘。我一直安慰自己觉壶,他們只是感情好脑题,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著铜靶,像睡著了一般叔遂。 火紅的嫁衣襯著肌膚如雪他炊。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 51,692評(píng)論 1 305
  • 那天已艰,我揣著相機(jī)與錄音痊末,去河邊找鬼。 笑死哩掺,一個(gè)胖子當(dāng)著我的面吹牛凿叠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播嚼吞,決...
    沈念sama閱讀 40,416評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼盒件,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了舱禽?” 一聲冷哼從身側(cè)響起炒刁,我...
    開(kāi)封第一講書人閱讀 39,326評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎誊稚,沒(méi)想到半個(gè)月后翔始,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,782評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡里伯,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評(píng)論 3 337
  • 正文 我和宋清朗相戀三年城瞎,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片疾瓮。...
    茶點(diǎn)故事閱讀 40,102評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡全谤,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出爷贫,到底是詐尸還是另有隱情认然,我是刑警寧澤,帶...
    沈念sama閱讀 35,790評(píng)論 5 346
  • 正文 年R本政府宣布漫萄,位于F島的核電站卷员,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏腾务。R本人自食惡果不足惜毕骡,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望岩瘦。 院中可真熱鬧未巫,春花似錦、人聲如沸启昧。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,996評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)密末。三九已至握爷,卻和暖如春跛璧,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背新啼。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,113評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工追城, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人燥撞。 一個(gè)月前我還...
    沈念sama閱讀 48,332評(píng)論 3 373
  • 正文 我出身青樓座柱,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親物舒。 傳聞我的和親對(duì)象是個(gè)殘疾皇子色洞,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容