有些情況下照藻,我們需要處理源自同一張圖像的不同分辨率的圖像集合旁涤。這些不同分辨率的圖像組成的集合稱為圖像金字塔蝇刀。
圖像金字塔的主要類型可分為低通和帶通
有兩種常用圖像金字塔:
- Gaussian Pyramid (低通)
- Laplacian Pyramids (帶通)
之所以稱為金字塔搓萧,是因?yàn)榻鹱炙撞坑纱蟪叽绲脑瓐D組成毛甲,越往上層袒啼,尺寸越小哈扮,堆疊起來就是一個(gè)金字塔的形式:
金字塔的生成過程
- 低通金字塔:使用一個(gè)恰當(dāng)?shù)钠交琭ilter對(duì)圖像進(jìn)行平滑處理,接著對(duì)平滑之后的圖像進(jìn)行下采樣(subsampling)瘤泪,下采樣因子通常為2.(分別對(duì)應(yīng)各個(gè)坐標(biāo)軸)灶泵。繼續(xù)對(duì)得出的結(jié)果圖像做相同的操作,重復(fù)這個(gè)步驟多次对途。每循環(huán)一次赦邻,會(huì)得出一副更小的、平滑程度更高的实檀、分辨率更低的圖像惶洲。
如果把原圖放在最底部,之后每一次的生成圖像都堆疊到上一次的結(jié)果之上膳犹,就形成了金字塔的形狀 - 帶通金字塔:通過將金字塔中相鄰兩層圖像做差得到恬吕。由于相鄰兩層圖像尺寸不同,因此需要進(jìn)行一些圖像插值操作须床,已達(dá)到計(jì)算像素間差值的目的铐料。
具體的,拉普拉斯金字塔(Laplacian Pyramids)中的每一層,是由高斯金字塔的對(duì)應(yīng)層以及高一層(需要先插值放大)做差而成钠惩。
Scale Space 尺度空間
尺度空間: 將一幅圖像表示為一系列的平滑圖像柒凉,稱為尺度空間表示,這些平滑圖像可參數(shù)化表示為平滑核(用于抑制細(xì)尺度結(jié)構(gòu))的尺寸篓跛。
定義:
尺度空間的概念適用于有著任意數(shù)目變量的信號(hào)膝捞。而其在二維圖像上的應(yīng)用是最常見的。
尺度空間的其中一個(gè)主要類型愧沟,就是線性(高斯)尺度空間蔬咬。高斯尺度空間因其良好的性質(zhì)而被廣泛地應(yīng)用。
對(duì)于給定的一副二維圖像 f(x,y)沐寺,他的線性(高斯)尺度空間表示是由一系列的派生信號(hào)L(x,y;t)所組成林艘,其中L(x,y,;t)由f(x,y)與一個(gè)二維高斯核卷積而成,其中二維高斯核定義如下:
因此有:
其中 * 號(hào)代表卷積芽丹。 分號(hào)表示卷機(jī)操作只對(duì) x,y 這兩個(gè)變量進(jìn)行北启,t僅指代定義好的尺度級(jí)別(scale level)卜朗。上述L 適用于連續(xù)的尺度級(jí)別 t≥0拔第, 但一般情況下僅會(huì)考慮離散的一組t
尺度參數(shù) t=σ^2 是高斯filter的方差。當(dāng)t趨于零時(shí)场钉,g就成為了一個(gè)脈沖函數(shù)(除了零點(diǎn)蚊俺,別處的函數(shù)值都為零),則有 L(x,y;0)=f(x,y), 也就是說逛万,位于尺度級(jí)別 t = 0 的尺度空間表示(scale-space representation)就是原圖本身泳猬。隨著t的增大,越來越大的filter被作用于圖像f宇植,形成平滑度越來越高的L得封,以至于原圖中越來越多的細(xì)節(jié)被丟棄。由于每個(gè)filter的標(biāo)準(zhǔn)差為σ=√t, 對(duì)于位于尺度等級(jí)t的圖像指郁,遠(yuǎn)小于√t的細(xì)節(jié)很大程度上會(huì)被丟棄忙上。
關(guān)于filter的選取
并非任何低通filter都可用于生成尺度空間∠锌玻可用于生成尺度空間的filter必須滿足以下一點(diǎn):由該平滑filter生成的粗尺度圖像(高層圖像)不會(huì)引入不存在于細(xì)尺度圖像(低層圖像)中的雜散結(jié)構(gòu)疫粥。換言之,給定粗尺度圖像中的任何一個(gè)區(qū)域腰懂,細(xì)尺度圖像上總能找到相應(yīng)的區(qū)域梗逮。這兩個(gè)區(qū)域相比,粗尺度圖像區(qū)域不能夠有新的結(jié)構(gòu)绣溜。
受制于尺度空間公理慷彤,高斯卷積核是實(shí)現(xiàn)尺度變換的唯一線性核。
為什么要提出尺度空間?
在現(xiàn)實(shí)世界中底哗,物體在不同尺度下贷屎,有著不同的結(jié)構(gòu)。這就表明艘虎,我們?nèi)绻麖牟煌某叨热ビ^察同一個(gè)物體唉侄,會(huì)得出不一樣的結(jié)果。比如野建,觀察一棵樹的適當(dāng)尺度應(yīng)該是“米”属划,而觀察一片葉子可能需要更細(xì)粒度的尺度才能得出較好的結(jié)果。 當(dāng)計(jì)算機(jī)系統(tǒng)要對(duì)一個(gè)未知的場景進(jìn)行分析時(shí)候生,并不能夠提前預(yù)知要用什么樣的尺度來對(duì)圖像信息中的興趣結(jié)構(gòu)(interesting structures)進(jìn)行描述才是最合適的同眯。因此,唯一可行的方案就是將多個(gè)不同尺度的描述都考慮進(jìn)來唯鸭,以便捕獲未知的尺度變化须蜗。
尺度空間理論和生物視覺之間也有著十分密切的聯(lián)系。哺乳動(dòng)物的視網(wǎng)膜以及視覺皮層第一階段所記錄的接受場的分布目溉,與許多尺度空間操作都高度近似明肮。
參考鏈接:
https://en.wikipedia.org/wiki/Scale_space
http://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_imgproc/py_pyramids/py_pyramids.html
https://en.wikipedia.org/wiki/Pyramid_(image_processing)