HoG特征SVM物品識別系統(tǒng)

公式完整版渲染請移步個人博客

系統(tǒng)架構(gòu)

structure.png

該系統(tǒng)仍然是基于滑動框+傳統(tǒng)機器學(xué)習(xí)的目標(biāo)識別系統(tǒng)谦屑,分為兩個主要部分:

  • HoG特征提然炻堋:從滑動框中提取出的子圖中提取HoG特征
  • 支持向量機(SVM):以子圖的HoG特征為輸入,判斷該子圖中是否有物品

HoG特征

該系統(tǒng)的最大貢獻(xiàn)為提出基于梯度的HoG(locally normalized Histogram of Oriented Gradient)特征桐猬,該特征的計算流程分為5步茫船,分別如下所示:

hog.png

歸一化

歸一化目的是去除光線的影響愿棋,gamma校正的公式如下所示:
y(x,y) = I(x,y)^{gamma}
原論文嘗試了多種輸入方法近速,包括灰度圖像和彩色圖像與是否gamma校正的組合诈嘿,由于這一步對最終結(jié)果影響很小,因此最終默認(rèn)為使用彩色輸入削葱,不進(jìn)行g(shù)amma校正永淌。

梯度計算

梯度的計算使用相鄰或不相鄰的像素值相減獲得,兩個方向的梯度和計算出整體梯度的角度和模佩耳。原論文嘗試了多種計算方法,最終使用的計算方法如下所示:

$$
grad_x(x,y) = I(x+1,y) - I(x-1,y) \\
grad_y(x,y) = I(x,y+1) - I(x,y-1) \\
||grad(x,y)|| = \sqrt{grad_x(x,y)^2 + grad_y(x,y)^2} \\
grad_{\theta}(x,y) = arctan(\cfrac{grad_y(x,y)}{grad_x(x,y)})
$$

其中grad_x(x,y)grad_y(x,y)的計算方法分別是與及其[-1,0,1]轉(zhuǎn)置與這一步的輸入圖片卷積谭跨。若輸入圖片的輸入通道不為1干厚,那么將其所有通道的數(shù)據(jù)組合到一個向量中。

直方特征統(tǒng)計

該步驟是引入非線性的關(guān)鍵步驟螃宙,該步驟是基于一種被稱為cell的結(jié)構(gòu)蛮瞄,一個cell由一個正方形的塊覆蓋的像素組成,論文中使用的cell尺寸為4x4谆扎。對于一個cell中的所有像素統(tǒng)計一種直方圖挂捅,該直方圖的橫軸為梯度方向,縱軸為梯度模堂湖,如下圖所示:

hog_binning.png

角度落在相同區(qū)間的梯度的模累加闲先,作為該區(qū)間的結(jié)果。上圖為0~180度分為4個區(qū)域的劃分无蜂,最終產(chǎn)生四個數(shù)據(jù)伺糠,分別是角度落在四個角度區(qū)域的梯度的模之和。原論文中斥季,角度區(qū)域的劃分方法對最終結(jié)果有一定的影響训桶,最終試驗后使用0~180度劃分9個區(qū)域的劃分方法(每個20度),每個cell產(chǎn)生9個數(shù)據(jù)酣倾。

特征歸一化

特征的歸一化基于block結(jié)構(gòu)舵揭,該結(jié)構(gòu)由一些cell組成,分為R-HoG和C-HoG兩種躁锡。其中R-HoG應(yīng)用較多午绳,由相鄰的構(gòu)成方形的cell,block可以相互重疊稚铣,可以參考重疊的池化箱叁。C-HoG的block為圓形墅垮,未能找到資料,且論文描述較含糊耕漱。屬于一個block的所有cell的數(shù)據(jù)組成一個向量算色。

標(biāo)準(zhǔn)化中,基于block的標(biāo)準(zhǔn)化使用cell組成的向量標(biāo)準(zhǔn)化螟够,可以使用L2-Hys灾梦,L2標(biāo)準(zhǔn)化和帶開方的L1標(biāo)準(zhǔn)化。L1與L2標(biāo)準(zhǔn)化如下所示:

$$
L1:v = \sqrt{\cfrac{v}{||v||_1 + e}} \\
L2:v = \cfrac{v}{\sqrt{||v||_2^2+e}}
$$

其中v為待標(biāo)準(zhǔn)化向量妓笙,e為為了防止除0的很小的常數(shù)若河。L2-Hys標(biāo)準(zhǔn)化首先進(jìn)行L2標(biāo)準(zhǔn)化,對結(jié)果進(jìn)行截短寞宫,再進(jìn)行L2標(biāo)準(zhǔn)化萧福,以上所述的標(biāo)準(zhǔn)化方法對結(jié)果影響均不大,論文中使用L2-Hys標(biāo)準(zhǔn)化辈赋。

除了這種標(biāo)準(zhǔn)化方式鲫忍,論文中還提到了基于周圍cell的標(biāo)準(zhǔn)化方式,但效果不佳钥屈。

組合特征

特征計算完成后悟民,將所有block特征組合為一個向量,該向量即為后端SVM的輸入篷就。

SVM(支持向量機)

使用支持向量機判斷候選框中是否有物品射亏,支持向量機的輸入為組合成向量的HoG特征,輸出為是否是待檢測物品竭业。

代碼實踐

import cv2


def detectFaces(img):
    hog = cv2.HOGDescriptor()
    if img.ndim == 3:
        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    else:
        gray = img

    faces, _ = hog.detectMultiScale(
        gray)
    print(faces)
    result = []
    for (x, y, width, height) in faces:
        result.append((x, y, x + width, y + height))
    return result


def drawFaces(img, draw, color=(255, 0, 0)):
    for (x1, y1, x2, y2) in draw:
        cv2.rectangle(img, (x1, y1), (x2, y2), color, 2)
    return img

if __name__ == '__main__':
    cap = cv2.VideoCapture(0)
    while(1):
        # get a frame
        ret, frame = cap.read()

        frame_face1 = detectFaces(frame)
        # frame_face2 = detectFaces(
        #     frame, "./haarcascades/haarcascade_profileface.xml")
        # frame_eye = detectFaces(
        #     frame, "./haarcascades/haarcascade_mcs_nose.xml")
        # frame_nose = detectFaces(
        #     frame, "./haarcascades/haarcascade_mcs_rightear.xml")

        frame = drawFaces(frame, frame_face1)
        # frame = drawFaces(frame, frame_face2, (0, 255, 0))
        # frame = drawFaces(frame, frame_eye, (0, 0, 255))
        # frame = drawFaces(frame, frame_nose, (255, 0, 255))

        cv2.imshow("capture", frame)
        if cv2.waitKey(1) == 0:
            break
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末智润,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子永品,更是在濱河造成了極大的恐慌做鹰,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,406評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鼎姐,死亡現(xiàn)場離奇詭異钾麸,居然都是意外死亡,警方通過查閱死者的電腦和手機炕桨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,395評論 3 398
  • 文/潘曉璐 我一進(jìn)店門饭尝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人献宫,你說我怎么就攤上這事钥平。” “怎么了姊途?”我有些...
    開封第一講書人閱讀 167,815評論 0 360
  • 文/不壞的土叔 我叫張陵涉瘾,是天一觀的道長知态。 經(jīng)常有香客問我,道長立叛,這世上最難降的妖魔是什么负敏? 我笑而不...
    開封第一講書人閱讀 59,537評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮秘蛇,結(jié)果婚禮上其做,老公的妹妹穿的比我還像新娘。我一直安慰自己赁还,他們只是感情好妖泄,可當(dāng)我...
    茶點故事閱讀 68,536評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著艘策,像睡著了一般蹈胡。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上朋蔫,一...
    開封第一講書人閱讀 52,184評論 1 308
  • 那天审残,我揣著相機與錄音,去河邊找鬼斑举。 笑死,一個胖子當(dāng)著我的面吹牛病涨,可吹牛的內(nèi)容都是我干的富玷。 我是一名探鬼主播,決...
    沈念sama閱讀 40,776評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼既穆,長吁一口氣:“原來是場噩夢啊……” “哼赎懦!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起幻工,我...
    開封第一講書人閱讀 39,668評論 0 276
  • 序言:老撾萬榮一對情侶失蹤励两,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后囊颅,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體当悔,經(jīng)...
    沈念sama閱讀 46,212評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,299評論 3 340
  • 正文 我和宋清朗相戀三年踢代,在試婚紗的時候發(fā)現(xiàn)自己被綠了盲憎。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,438評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡胳挎,死狀恐怖饼疙,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情慕爬,我是刑警寧澤窑眯,帶...
    沈念sama閱讀 36,128評論 5 349
  • 正文 年R本政府宣布屏积,位于F島的核電站,受9級特大地震影響磅甩,放射性物質(zhì)發(fā)生泄漏炊林。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,807評論 3 333
  • 文/蒙蒙 一更胖、第九天 我趴在偏房一處隱蔽的房頂上張望铛铁。 院中可真熱鬧,春花似錦却妨、人聲如沸饵逐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,279評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽倍权。三九已至,卻和暖如春捞烟,著一層夾襖步出監(jiān)牢的瞬間薄声,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,395評論 1 272
  • 我被黑心中介騙來泰國打工题画, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留默辨,地道東北人。 一個月前我還...
    沈念sama閱讀 48,827評論 3 376
  • 正文 我出身青樓苍息,卻偏偏與公主長得像缩幸,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子竞思,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,446評論 2 359

推薦閱讀更多精彩內(nèi)容