周五去計算所面談唱捣,被得知是打ACM的就沒有被問任何傳統(tǒng)概念上的算法抠蚣,倒是盯著簡歷被問了一堆曾經(jīng)做過的模式識別相關(guān)的內(nèi)容赊堪。經(jīng)典模型的原理對答如流买羞,唯獨(dú)最經(jīng)典的三種目標(biāo)檢測特征:hog、lbp雹食、haar中的haar我是一點(diǎn)都沒有看過的(偷懶了)畜普,于是似乎被鄙視了一下?
最終的結(jié)果群叶,老師對我很滿意吃挑,我對老師也很滿意(钝荡??舶衬?)埠通,直接被安利了一坨實驗室項目,以及問要不要直接來做畢設(shè)逛犹。
劉老師所在的實驗室是泛在計算系統(tǒng)研究中心端辱,是去年1月份新合并的實驗室,研究方向有很多虽画,劉老師研究的方向大致就是計算機(jī)視覺和模式識別舞蔽,曾經(jīng)做過一些針對性比較強(qiáng)的課題,在官網(wǎng)上看到她十年前就發(fā)過好幾篇頂會码撰,但是隨后就不再更新了渗柿,只是當(dāng)面聊才得知最近因為深度學(xué)習(xí)很火于是他們也開始做這方面的研究了。
在計算所的樓里轉(zhuǎn)了轉(zhuǎn)脖岛,感覺不錯朵栖,很像一個大廠。聽LZG說網(wǎng)特別爛柴梆,上百度要6s陨溅,叫我做好準(zhǔn)備,我:emmmm…
回學(xué)校頹了一晚上绍在,第二天開始找haar的資料声登,準(zhǔn)備補(bǔ)一下這個。于是就翻到了龍女士(揣苏?悯嗓??)的這篇碩士論文
基于Adaboost的人臉檢測方法及眼睛定位算法研究 龍伶敏 電子科技大學(xué)
本來只是想擼一下haar特征的卸察,但是感覺一般畢業(yè)論文都會把研究路徑寫得比較詳細(xì)(比期刊高到不知道哪里去了)脯厨,于是順便讀完了整本。
補(bǔ)了一些姿勢:
haar特征:定義模板坑质,模板有兩部分合武,用模板按比例放縮對圖像進(jìn)行分兩部分求和再作差,主要用了一個矩陣前綴和優(yōu)化涡扼,是個非常簡單的dp稼跳,我覺得其實可以用二維樹狀數(shù)組來替代這個預(yù)處理,但是優(yōu)勢僅能在顏色分布比較單一的條件下才有效吃沪。由于圖像有可能非常大汤善,所以還需要類似水平或者垂直深度直方圖之類的手段進(jìn)行粗定位,之后在定位的范圍內(nèi)使用haar特征,這具體實現(xiàn)要分析檢測目標(biāo)的色彩深度特點(diǎn)红淡。
PAC(概率近似正確框架):從合理數(shù)量的訓(xùn)練數(shù)據(jù)中通過合理的計算量可靠的學(xué)習(xí)到知識不狮,使得保證假設(shè)是有一定概率為正確的一種設(shè)計分類器的思路。
Boost&AdaBoost算法:將弱學(xué)習(xí)分類器通過某種(比如級聯(lián))方式結(jié)合起來在旱,構(gòu)造成強(qiáng)分類器的一種分類算法摇零。
瀑布(Cascade)算法:基于AdaBoost算法的強(qiáng)分類算法。
隱馬爾科夫模型:似乎在cv上很少用桶蝎,還有什么躍遷矩陣驻仅。算了,我連馬爾科夫鏈?zhǔn)鞘裁炊疾恢赖窃@個棄了噪服。
這篇論文讀完可以說是收獲很多,除了haar特征以外绍豁,還學(xué)到了不少圖形學(xué)方面的知識,以及做研究和寫論文的思路牙捉。
這篇論文其實還是有很多細(xì)節(jié)處理得比較粗糙的竹揍,比如論文第39頁設(shè)置窗口放大系數(shù)為1.2的時候并沒有闡述原因,只是隨口一提邪铲。39芬位、40頁提到多ROI區(qū)域合并的時候簡單使用坐標(biāo)的幾何中心以及區(qū)域邊長均值做合并后的ROI,諸如此類带到。
以及自己的一些想法:文章里提到過一個利用離散對稱變換的方法定位一個對稱特征(比如眼睛)昧碉,其實我覺得這里可以把對稱思想應(yīng)用到直方圖中,做一側(cè)的對稱采樣點(diǎn)揽惹,求差的絕對值最小被饿,認(rèn)為是對稱。