轉自:NMS——非極大值抑制
這篇文章說的不是很清楚冤寿,NMS的過程是這樣的(出自:非極大抑制(Non-maximum suppression)):
先假設有6個矩形框涯穷,根據(jù)分類器類別分類概率做排序儒洛,從小到大分別屬于車輛的概率分別為A、B册烈、C强经、D、E掺涛、F庭敦。
(1)從最大概率矩形框F開始,分別判斷A~E與F的重疊度IOU是否大于某個設定的閾值;
(2)假設B鸽照、D與F的重疊度超過閾值螺捐,那么就扔掉B、D;并標記第一個矩形框F定血,是我們保留下來的赔癌。
(3)從剩下的矩形框A、C澜沟、E中灾票,選擇概率最大的E,然后判斷E與A茫虽、C的重疊度刊苍,重疊度大于一定的閾值,那么就扔掉濒析;并標記E是我們保留下來的第二個矩形框正什。
就這樣一直重復,找到所有被保留下來的矩形框号杏。
NMS(non maximum suppression)婴氮,中文名非極大值抑制,在很多計算機視覺任務中都有廣泛應用盾致,如:邊緣檢測主经、目標檢測等。
這里主要以人臉檢測中的應用為例庭惜,來說明NMS罩驻,并給出Matlab和C++示例程序。
NMS改進:一行代碼改進NMS
人臉檢測的一些概念
(1) 絕大部分人臉檢測器的核心是分類器护赊,即給定一個尺寸固定圖片惠遏,分類器判斷是或者不是人臉;
(2)將分類器進化為檢測器的關鍵是:在原始圖像上從多個尺度產(chǎn)生窗口百揭,并resize到固定尺寸爽哎,然后送給分類器做判斷蜓席。最常用的方法是滑動窗口器一。
以下圖為例,由于滑動窗口厨内,同一個人可能有好幾個框(每一個框都帶有一個分類器得分)
而我們的目標是一個人只保留一個最優(yōu)的框:
于是我們就要用到非極大值抑制祈秕,來抑制那些冗余的框: 抑制的過程是一個迭代-遍歷-消除的過程。
(1)將所有框的得分排序雏胃,選中最高分及其對應的框:
(2)遍歷其余的框请毛,如果和當前最高分框的重疊面積(IOU)大于一定閾值,我們就將框刪除瞭亮。
(3)從未處理的框中繼續(xù)選一個得分最高的方仿,重復上述過程。
下面給出MATLAB下的快速NMS代碼,并帶有詳細的注釋:
%% NMS:non maximum suppression
function pick = nms(boxes,threshold,type)
% boxes: m x 5,表示有m個框仙蚜,5列分別是[x1 y1 x2 y2 score]
% threshold: IOU閾值
% type:IOU閾值的定義類型
% 輸入為空此洲,則直接返回
if isempty(boxes)
pick = [];
return;
end
% 依次取出左上角和右下角坐標以及分類器得分(置信度)
x1 = boxes(:,1);
y1 = boxes(:,2);
x2 = boxes(:,3);
y2 = boxes(:,4);
s = boxes(:,5);
% 計算每一個框的面積
area = (x2-x1+1) .* (y2-y1+1);
%將得分升序排列
[vals, I] = sort(s);
%初始化
pick = s*0;
counter = 1;
% 循環(huán)直至所有框處理完成
while ~isempty(I)
last = length(I); %當前剩余框的數(shù)量
i = I(last);%選中最后一個,即得分最高的框
pick(counter) = i;
counter = counter + 1;
%計算相交面積
xx1 = max(x1(i), x1(I(1:last-1)));
yy1 = max(y1(i), y1(I(1:last-1)));
xx2 = min(x2(i), x2(I(1:last-1)));
yy2 = min(y2(i), y2(I(1:last-1)));
w = max(0.0, xx2-xx1+1);
h = max(0.0, yy2-yy1+1);
inter = w.*h;
%不同定義下的IOU
if strcmp(type,'Min')
%重疊面積與最小框面積的比值
o = inter ./ min(area(i),area(I(1:last-1)));
else
%交集/并集
o = inter ./ (area(i) + area(I(1:last-1)) - inter);
end
%保留所有重疊面積小于閾值的框委粉,留作下次處理
I = I(find(o<=threshold));
end
pick = pick(1:(counter-1));
end
https://github.com/AITTSMD/MTCNN-Tensorflow 中的python 實現(xiàn):
import numpy as np
def py_nms(dets, thresh, mode="Union"):
"""
greedily select boxes with high confidence
keep boxes overlap <= thresh
rule out overlap > thresh
:param dets: [[x1, y1, x2, y2 score]]
:param thresh: retain overlap <= thresh
:return: indexes to keep
"""
x1 = dets[:, 0]
y1 = dets[:, 1]
x2 = dets[:, 2]
y2 = dets[:, 3]
scores = dets[:, 4]
areas = (x2 - x1 + 1) * (y2 - y1 + 1)
order = scores.argsort()[::-1]
keep = []
while order.size > 0:
i = order[0]
keep.append(i)
xx1 = np.maximum(x1[i], x1[order[1:]])
yy1 = np.maximum(y1[i], y1[order[1:]])
xx2 = np.minimum(x2[i], x2[order[1:]])
yy2 = np.minimum(y2[i], y2[order[1:]])
w = np.maximum(0.0, xx2 - xx1 + 1)
h = np.maximum(0.0, yy2 - yy1 + 1)
inter = w * h
if mode == "Union":
ovr = inter / (areas[i] + areas[order[1:]] - inter)
elif mode == "Minimum":
ovr = inter / np.minimum(areas[i], areas[order[1:]])
#keep
inds = np.where(ovr <= thresh)[0]
order = order[inds + 1]
return keep