一般來說,我們都是處理固定大小的圖片,但是有時(shí)候也會(huì)需要處理一個(gè)圖像的不同分辨率的圖片。比如在搜索圖像里的某些元素的時(shí)候股毫,比如臉暑认,我們并不確認(rèn)目標(biāo)在圖片里的大小困介。在這種情況下,我們可能需要?jiǎng)?chuàng)建一系列的不同分辨率的圖片來在其中尋找目標(biāo)蘸际。這些不同分辨率的圖片叫做圖片金字塔(因?yàn)樗麄儚男〉酱蠖言谝黄鸬臅r(shí)候像個(gè)金字塔)
有兩種圖像金字塔1)高斯金字塔 2)拉普拉斯金字塔
高斯金字塔的高級(jí)(低分辨率)是從低級(jí)別(高分辨率)的圖像里移除連續(xù)的行和列來形成的座哩。高級(jí)別理的每個(gè)像素是下級(jí)5個(gè)高斯權(quán)重的像素得到的。通過這種方法粮彤,一個(gè)M x N的圖像變成了M/2 x N/2的圖像根穷。所以面積減小到了原來的四分之一。這被叫做Octave导坟。同樣的模式我們可以不斷向上(減小分辨率)屿良。同樣的如果是擴(kuò)大,編輯會(huì)變成原來級(jí)別的四倍惫周。我們用cv2.pyrDown()和cv2.pyrUp()函數(shù)來找高斯金字塔尘惧。
img = cv2.imread('messi5.jpg')
lower_reso = cv2.pyrDown(higher_reso)
下面是圖像金字塔的4級(jí)
現(xiàn)在你可以通過cv2.pyrUp()函數(shù)來沿圖像金字塔向下
higher_reso2 = cv2.pyrUp(lower_reso)
記住,higher_reso2和higher_reso不同递递,因?yàn)橐坏┠憬档土朔直媛逝绯龋憔蛠G失了圖像信息,下面的圖像是用前面最小的圖片向金字塔下3級(jí)的結(jié)果登舞。
拉普拉斯金字塔式從高斯金字塔得到的贰逾,沒有單獨(dú)的函數(shù)。拉普拉斯金字塔圖像像是邊緣圖片菠秒,大部分元素是0.它被用在圖像壓縮上疙剑,拉普拉斯金字塔的一級(jí)是由那一級(jí)的高斯金字塔和他的更高一級(jí)的高斯金字塔的圖像差別來生成的。拉普拉斯的三個(gè)級(jí)別可能是這樣的:
用金字塔來混合圖像
一個(gè)金字塔的應(yīng)用是圖像混合,比如拼接中言缤,你可能會(huì)需要把兩個(gè)圖像堆到一起嚼蚀,不過可能會(huì)因?yàn)閳D像不連續(xù)而不好看,在這種情況下轧简,用金字塔進(jìn)行圖像混合可以讓圖片無縫混合驰坊。一個(gè)典型的例子是混合兩種水果,桔子和蘋果哮独∪剑看下面的結(jié)果:
簡(jiǎn)單來說,它完成了下面這些工作:
1.加載兩張圖片皮璧,蘋果和桔子的舟扎。
2.找到蘋果和桔子的高斯金字塔(在這個(gè)例子里,一共6級(jí))
3.從高斯金字塔找到拉普拉斯金字塔
4.把左半個(gè)蘋果和右半個(gè)桔子在拉普拉斯金字塔的每個(gè)級(jí)別合起來
5.最后從這些圖像金字塔里重建出原始圖像悴务。
import cv2
import numpy as np, sys
A = cv2.imread('apple.jpg')
B = cv2.imread('orange.jpg')
# generate Gaussian pyramid for A
G = A.copy()
gpA = [G]
for i in xrange(6):
? ? G = cv2.pyrDown(G)
? ? gpA.append(G)
# generate Gaussian pyramid for B
G = B.copy()
gpB = [G]
for i in xrange(6):
? ? G = cv2.pyrDown(G)
? ? gpB.append(G)
# generate Laplacian Pyramid for A
lpA = [gpA[5]]
for i in xrange(5,0,-1):
? ? GE = cv2.pyrUp(gpA[i])
? ? L = cv2.subtract(gpA[i-1],GE)
? ? lpA.append(L)
# generate Laplacian Pyramid for B
lpB = [gpB[5]]
for i in xrange(5,0,-1):
? ? GE = cv2.pyrUp(gpB[i])
? ? L = cv2.subtract(gpB[i-1],GE)
? ? lpB.append(L)
# Now add left and right halves of images in each level
LS = []
for la, lb in zip(lpA,lpB):
? ? rows, cols, dpt=la.shape
? ? ls = np.hstack((la[:,0:cols/2],lb[:,cols/2:]))
? ? LS.append(ls)
# now reconstruct
ls_ = LS[0]
for i in xrange(1,6):
? ? ls_ = cv2.pyrUp(ls_)
? ? ls_ = cv2.add(ls_,LS[i])
# image with direct connecting each half
real = np.hstack((A[:,:cols/2],B[:,cols/2:]))
cv2.imwrite('Pyramid_blending2.jpg',ls_)
cv2.imwrite('Direct_blending.jpg',real)