計算直方圖calcHist
直方圖是對數(shù)據(jù)集合的統(tǒng)計 ,并將統(tǒng)計結(jié)果分布于一系列預定義的bins中淮蜈。這里的數(shù)據(jù)不僅僅指的是灰度值 哺窄,統(tǒng)計數(shù)據(jù)可能是任何能有效描述圖像的特征。
假設(shè)有一個矩陣包含一張圖像的信息 (灰度值 0-255):
既然已知數(shù)字的范圍包含256個值, 我們可以將這個范圍分割成子區(qū)域(稱作 bins)到腥,如:
然后再統(tǒng)計掉入每一個bin_{i}的像素數(shù)目朵逝。采用這一方法來統(tǒng)計上面的數(shù)字矩陣,我們可以得到下圖( x軸表示 bin乡范, y軸表示各個bin中的像素個數(shù))配名。
直方圖可以統(tǒng)計的不僅僅是顏色灰度,它可以統(tǒng)計任何圖像特征(如梯度,方向等等)晋辆。
直方圖具體細節(jié)
dims: 需要統(tǒng)計的特征的數(shù)目渠脉,在上例中,dims = 1因為我們僅僅統(tǒng)計了灰度值(灰度圖像)
bins: 每個特征空間子區(qū)段的數(shù)目瓶佳,在上例中芋膘,bins = 16
range: 每個特征空間的取值范圍,在上例中霸饲,range = [0,255]
OpenCV的直方圖計算
OpenCV提供了一個簡單的計算數(shù)組集(通常是圖像或分割后的通道)的直方圖函數(shù)calcHist为朋。支持高達32維的直方圖。
void calcHist(
const Mat* arrays, // 圖像源數(shù)組厚脉,同樣深度(CV_8U or CV_32F)习寸,同樣大小
int narrays, // 圖片個數(shù)
const int* channels, // 通道
InputArray mask, // 掩碼圖像
OutputArray hist, // 返回的直方圖
int dims, // 直方圖的維數(shù)
const int* histSize, // 每一維上直方圖的個數(shù)
const float** ranges, // 像素值的范圍
bool uniform=true,
bool accumulate=false );
說明:
channels - 用來計算直方圖的channels的數(shù)組
mask - 掩碼。如果mask不為空傻工,那么它必須是一個8位(CV_8U)的數(shù)組霞溪,并且它的大小的和arrays[i]的大小相同,值為1的點將用來計算
dim - 直方圖的維數(shù)精钮。必須為正威鹿,并且不大于CV_MAX_DIMS(當前的OpenCV版本中為32,即最大可以統(tǒng)計32維的直方圖)
histSize - 在每一維上直方圖的個數(shù)轨香。簡單把直方圖看作一個一個的豎條的話忽你,就是每一維上豎條的個數(shù)
ranges - 用來進行統(tǒng)計的范圍
反投影直方圖
反向投影是一種記錄給定圖像中的像素點如何適應直方圖模型像素分布的方式。
簡單的講臂容,所謂反向投影就是首先計算某一特征的直方圖模型科雳,然后使用模型去尋找圖像中存在的該特征。
void calcBackProject(
const Mat* arrays,
int narrays,
const int* channels,
InputArray hist,
OutputArray backProject,
const float** ranges,
double scale=1, bool uniform=true );
hist - 輸入直方圖
backProject - 反投影向量脓杉,這是一個單通道的向量糟秘,和arrays[0]具有相同的大小和深度
下面使用膚色直方圖為例來解釋反向投影的工作原理:
使用模型直方圖(代表手掌的皮膚色調(diào))來檢測測試圖像中的皮膚區(qū)域,
- 對測試圖像中的每個像素 ( p(i,j) ),獲取色調(diào)數(shù)據(jù)并找到該色調(diào)( h(i,j), s(i,j) )在直方圖中的bin的位置
- 查詢 模型直方圖 中對應的bin( h(i,j), s(i,j) )并讀取該bin的數(shù)值
- 將此數(shù)值儲存在新的圖像中(BackProjection)球散。 你也可以先歸一化 模型直方圖 ,這樣測試圖像的輸出就可以在屏幕顯示了
通過對測試圖像中的每個像素采用以上步驟尿赚, 得到 BackProjection 結(jié)果圖
- 使用統(tǒng)計學的語言, BackProjection 中儲存的數(shù)值代表了測試圖像中該像素屬于皮膚區(qū)域的概率。比如以上圖為例, 亮起的區(qū)域是皮膚區(qū)域的概率更大(事實確實如此),而更暗的區(qū)域則表示更低的概率
閾值化
閾值是最簡單的圖像分割的方法凌净。
應用舉例:從一副圖像中利用閾值分割出我們需要的物體部分(當然這里的物體可以是一部分或者整體)悲龟。這樣的圖像分割方法是基于圖像中物體與背景之間的灰度差異,而且此分割屬于像素級的分割冰寻。
為了從一副圖像中提取出我們需要的部分须教,應該用圖像中的每一個像素點的灰度值與選取的閾值進行比較,并作出相應的判斷斩芭。(注意:閾值的選取依賴于具體的問題轻腺。即:物體在不同的圖像中有可能會有不同的灰度值。)
一旦找到了需要分割的物體的像素點划乖,我們可以對這些像素點設(shè)定一些特定的值來表示贬养。(例如:可以將該物體的像素點的灰度值設(shè)定為:‘0’(黑色),其他的像素點的灰度值為:‘255’(白色);當然像素點的灰度值可以任意琴庵,但最好設(shè)定的兩種顏色對比度較強煤蚌,方便觀察結(jié)果)。
閾值類型
閾值A(chǔ)PI
double threshold(
InputArray src,
OutputArray dst,
double thresh,
double maxVal,
int thresholdType);
均值漂移(Mean Shift)算法函數(shù)
該函數(shù)利用了迭代物體搜索算法细卧,它要以一個物體的反射直方圖(back projection)和初始位置作為輸入。
搜索窗口的重心向反射直方圖的質(zhì)心(mass center)移動筒占,該過程不斷的重復贪庙,直到達到了迭代的次數(shù)(criteria.maxCount),或者窗口中心小于一個閾值(criteria.epsilon)翰苫。
int meanShift(
InputArray probImage, // Back projection of the object histogram
Rect& window, // Initial search window
TermCriteria criteria // Stop criteria for the iterative search algorithm.
);
Camshift算法函數(shù)
該函數(shù)首先利用meanShift()函數(shù)找到物體的中心止邮,然后調(diào)整窗口的大小并找到最優(yōu)的旋轉(zhuǎn)角度。該函數(shù)返回一個rotated rectangle數(shù)據(jù)結(jié)構(gòu)(包含物體的位置奏窑,大小和旋轉(zhuǎn)角度)导披。下一次搜索窗口的位置可以通過RotatedRect::boundingRect()得到。
RotatedRect CamShift(
InputArray probImage, // Back projection of the object histogram
Rect& window, // Initial search window
TermCriteria criteria // Stop criteria for the underlying meanShift()
);
TermCriteria模板類
該類是作為迭代算法的終止條件使用的埃唯,其構(gòu)造函數(shù)需要三個參數(shù):一個是類型撩匕,第二個參數(shù)為迭代的最大次數(shù),最后一個是特定的閾值墨叛。
TermCriteria(int type, int maxCount, double epsilon);
類型有CV_TERMCRIT_ITER止毕、CV_TERMCRIT_EPS、CV_TERMCRIT_ITER+CV_TERMCRIT_EPS漠趁,分別代表著迭代終止條件為達到最大迭代次數(shù)終止扁凛,迭代到閾值終止,或者兩者都作為迭代終止條件闯传。
參考資料
OpenCV Histograms API文檔
直方圖之calcHist使用
直方圖之calcHist使用(補)
OpenCV 教程 imgproc模塊
反向投影
閾值操作
轉(zhuǎn)載請注明作者Jason Ding及其出處
Github主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.reibang.com/users/2bd9b48f6ea8/latest_articles)