摘 要
人體識別是計算機視覺領域的一大類熱點問題盅弛,其研究內(nèi)容涵蓋了人體的監(jiān)測與跟蹤箩帚、手勢識別真友、動作識別、人臉識別紧帕、性別識別和行為與事件識別等盔然,有著非常廣泛的應用價值。隨機森林以它自身固有的特點和優(yōu)良的分類效果在眾多的機器學習算法中脫穎而出是嗜。隨機森林算法的實質(zhì)是一種樹預測器的組合愈案,其中每一棵樹都依賴于一個隨機向量,森林中的所有的向量都是獨立同分布的鹅搪。本文簡單介紹了隨機森林的原理站绪,并對近幾年來隨機森林在姿勢識別和人臉識別中的應用進行討論。
1.人體識別概述
人體識別是計算機視覺領域的一大類熱點問題丽柿,其研究內(nèi)容涵蓋了人體的監(jiān)測與跟蹤恢准、手勢識別、動作識別甫题、人臉識別馁筐、性別識別和行為與事件識別等。其研究方法幾乎囊括了所有的模式識別問題的理論與技術坠非,例如統(tǒng)計理論敏沉,變換理論,上下文相關性炎码,分類與聚類盟迟,機器學習,模板匹配辅肾,濾波等队萤。人體識別有著非常廣泛的應用價值。
絕大多數(shù)人臉識別算法和人臉表情分析算法在提取人臉特征之前,需要根據(jù)人臉關鍵點的位置(如眼角,嘴角)進行人臉的幾何歸一化處理矫钓。即使在已知人臉粗略位置的情況下,人臉關鍵點精確定位仍然是一個很困難的問題,這主要由外界干擾和人臉本身的形變造成要尔。
當前比較流行的算法有:基于啟發(fā)式規(guī)則的方法、主成分分析(PCA)新娜、獨立元分析(ICA)赵辕、基于K-L 變換、彈性圖匹配等概龄。
2.隨機森林綜述
隨機森林顧名思義还惠,使用隨機的方式建立一個森林,森林里面有很多的決策樹組成私杜,隨機森林的每一棵決策樹之間是沒有關聯(lián)的蚕键。在得到森林之后救欧,當有一個新的輸入樣本進入的死后,就讓森林的每一棵決策樹分別進行一下判斷锣光,看看這個樣本應該屬于哪一類(對于分類算法)笆怠,然后看看哪一類能被選擇最多,就預測這個樣本為那一類誊爹。
隨機森林是一種統(tǒng)計學習理論蹬刷,其隨機有兩個方面:首先是在訓練的每一輪中,都是對原始樣本集有放回的抽取固定數(shù)目的樣本點频丘,形成k個互不相同的樣本集办成。第二點是:對于每一個決策樹的建立是從總的屬性中隨機抽取一定量的屬性作分裂屬性集,這樣對于k個樹分類器均是不相同的搂漠。由隨機生成的k個決策樹組成了隨機森林迂卢。
對于每一個決策樹來講,其分裂屬性是不斷的選取具有最大信息增益的屬性進行排列状答。整個隨機森林建立后冷守,最終的分類標準采用投票機制得到可能性最高的結果。
下圖是隨機森林構建的過程:
圖1 隨機森林構建過程
3.隨機森林在人體識別中的應用
3.1 隨機森林應用于姿勢識別
以[1]一文來討論惊科,論文中所涉及到的人體識別過程主要分為兩步,首先是亮钦,身體部位標記:對于從單張景深圖像中對人體進行分段馆截,并標記出關鍵節(jié)點。之后進行身體關節(jié)定位蜂莉,將標記的各個人體部分重新映射到三維空間中蜡娶,對關鍵節(jié)點形成高可靠的空間定位。
圖2 深度圖像-身體部位標記-關節(jié)投影
文的最主要貢獻在于將姿勢識別的問題轉化成了物體識別的問題映穗,通過對身體不同部位的空間位置的確定來實現(xiàn)窖张,做到了低計算消耗和高精確度。在身體部位標記的過程中蚁滋,將問題轉化成了對每個像素的分類問題宿接,對于每個像素點,從景深的角度來確定該點的局域梯度特征辕录。該特征是點特征與梯度特征的良好結合睦霎。
舉個例子,對于不同點的相同屬性值的判別走诞,如下圖副女,圖a中的兩個測量點的像素偏移間均具有較大的景深差,而圖b中的景深差則明顯很小蚣旱。由此看出碑幅,不同位置像素點的特征值是有明顯差別的戴陡,這就是分類的基礎。
圖3 景深圖像特質(zhì)示例
文中對于決策樹的分裂屬性的選擇來說沟涨。由于某兩個像素點恤批、某些圖像特征選取的隨意性,將形成大量的備選劃分形式拷窜,選擇對于所有抽樣像素對于不同的分裂屬性劃分前后的信息熵增益進行比較开皿,選取最大的一組ψ=(θ, τ)作為當前分裂節(jié)點。(信息增益與該圖像塊最終是否正確地分類相關篮昧,即圖像塊歸屬于正確的關鍵特征點區(qū)域的概率赋荆。)
圖4 決策時分類說明
決策樹的建立后,某個葉子節(jié)點歸屬于特定關鍵特征點區(qū)域的概率可以根據(jù)訓練圖像最終分類的情況統(tǒng)計得到懊昨,這就是隨機森林在實際檢測特征點時的最重要依據(jù)窄潭。
在人體關節(jié)分類中,我們由形成的決策森林酵颁,來對每一個像素點的具體關節(jié)屬性進行判斷嫉你,并進行顏色分類。隨機森林這種基于大量樣本統(tǒng)計的方法能夠?qū)τ捎诠庹挣锿铩⒆冃缘仍斐傻挠绊懹奈郏瑢崟r地解決關鍵特征點定位的問題。
如圖所示簿姨,是對于景深圖像處理后的結果展示距误。
圖5 姿勢識別處理結果
應該這樣說,這篇文章在算法的層面對隨機森林沒有太大的貢獻扁位。在劃分函數(shù)的形式上很簡單准潭。這個團隊值得稱道的地方是通過計算機圖形學造出了大量的不同體型不同姿勢的各種人體圖像,用作訓練數(shù)據(jù)域仇,這也是成為2011年CVPR Best Paper的重要原因刑然。正是因為論文的成果運用于Kinect,在工業(yè)界有著巨大的作用暇务,落實到了商用的硬件平臺上泼掠,推動了隨機森林在計算機視覺、多媒體處理上的熱潮般卑。
3.2 隨機森林應用于人臉識別
基于回歸森林的臉部特征檢測通過分析臉部圖像塊來定位人臉的關鍵特征點武鲁,在此基礎上條件回歸森林方法考慮了全局的臉部性質(zhì)。對于[2]進行分析蝠检,這篇論文是2012年CVPR上的論文沐鼠,本文考慮的是臉部朝向作為全局性質(zhì)。其主要描述的問題是如何利用條件隨機森林,來確定面部10個關鍵特征點的位置饲梭。與之前不同的是乘盖,在隨機森林的基礎上,加入了面部朝向的條件約束憔涉。
圖6 臉部10個特征點
對于面部特征標記的問題轉化成了對大量圖像塊的分類問題订框。類似于人體識別中的局域梯度特征識別。本文中兜叨,對于每一個圖像塊來說穿扳,從灰度值、光照補償国旷、相位變換等圖像特征矛物,以及該圖像塊中心與各個特征點的距離來判斷圖像塊的位置特征。在決策樹的分裂屬性確定過程跪但,依然使用“最大信息熵增益”原則履羞。
圖7 條件隨機森林算法說明
文中提出了更進一步基于條件隨機森林的分類方法,即通過設定臉部朝向的約束對決策樹分類屡久,在特征檢測階段能夠根據(jù)臉部朝向選擇與之相關的決策樹進行回歸忆首,提高準確率和降低消耗。此論文還對條件隨機森林被环,即如何通過臉部朝向?qū)Q策進行分類進行了說明糙及,但這與隨機森林算法沒有太大關系,這里就不再繼續(xù)討論了筛欢。隨機森林這種基于大量樣本統(tǒng)計的方法能夠?qū)τ捎诠庹斩○摹⒆冃缘仍斐傻挠绊懀瑢崟r地解決關鍵特征點定位的問題悴能。
另一篇文章[3]對于臉部特征標記,提出了精確度更高雳灾、成本更低的方法漠酿。即,基于結構化輸出的隨機森林的特征標記方式谎亩。文中將面部劃分為20個特征點炒嘲,對于各個特征點來說,不僅有獨立的圖像塊分類標記匈庭,還加入了例如夫凸,點4,對于其他嘴唇特征點3,18,19的依賴關系的判斷阱持。這樣的方法使特征點標記準確率大大增加夭拌。
該方法依然是使用隨機森林的方法,有所不同的是引入了如式中所示的與依賴節(jié)點之間的關系。對于決策樹的建立依然是依賴信息熵增益原則來決定鸽扁,葉子節(jié)點不僅能得到特征的獨立劃分還會得到該特征對依賴特征的貢獻蒜绽,最終特征節(jié)點的判斷會綜合原始投票及空間約束。
圖8 臉部特征標記
圖9 決策樹依賴關系
例如當對下圖中人臉特征點進行分類時桶现,使用簡單的隨機森林方法躲雅,經(jīng)過判斷會將各個點進行標注,可以看到 紅色的點骡和,標注出的鼻子特征相赁。如果利用依賴節(jié)點進行判斷,鼻子的點會被局限在其他鼻子特征點的周圍慰于,進行疊加后钮科,得到了這個結果。顯然东囚,對于此節(jié)點的判斷跺嗽,利用結構輸出的方式,準確度更高了页藻。
圖10 結構化輸出結果
4.隨機森林總結
大量的理論和實證研究都證明了RF具有很高的預測準確率桨嫁,對異常值和噪聲具有很好的容忍度,且不容易出現(xiàn)過擬合份帐×О桑可以說,RF是一種自然的非線性建模工具废境,是目前數(shù)據(jù)挖掘算法最熱門的前沿研究領域之一畜挨。具體來說,它有以下優(yōu)點:
1.通過對許多分類器進行組合噩凹,它可以產(chǎn)生高準確度的分類器巴元;
2.它可以處理大量的輸入變量;
3.它可以在決定類別時驮宴,評估變量的重要性逮刨;
4.在建造森林時,它可以在內(nèi)部對于一般化后的誤差產(chǎn)生不偏差的估計堵泽;
5.它包含一個好方法可以估計遺失的資料修己,并且,如果有很大一部分的資料遺失迎罗,仍可以維持準確度睬愤。
6.它提供一個實驗方法,可以去偵測變量之間的相互作用纹安;
7.學習過程是很快速的尤辱;
8.對異常值和噪聲具有很好的容忍度砂豌,且不容易出現(xiàn)過擬合;
隨機森林的缺點:
1.對于有不同級別的屬性的數(shù)據(jù)啥刻,級別劃分較多的屬性會對隨機森林產(chǎn)生更大的影響奸鸯,所以隨機森林在這種數(shù)據(jù)上產(chǎn)出的屬性權值是不可信的;
2.單棵決策樹的預測效果很差:由于隨機選擇屬性可帽,使得單棵決策樹的預測效果很差娄涩。
參考文獻:
[1] Shotton, J.; Fitzgibbon, A.; Cook, M.; Sharp, T.; Finocchio, M.; Moore, R.; Kipman, A.; Blake, A., “Real-time human pose recognition in parts from single depth images,”Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on , vol., no., pp.1297,1304, 20-25 June 2011
[2] Dantone M, Gall J, Fanelli G, et al. Real-time facial feature detection using conditional regression forests[C]//Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012: 2578-2585.
[3] Heng Yang, Ioannis Patras, “Face Parts Localization Using Structured-output Regression Forests”, ACCV2012, Dajeon, Korea.
本文轉自:http://dataunion.org/12046.html映跟,僅供學習交流