AdaBoost慨绳,一個(gè)比Deep Learning還要久遠(yuǎn)的名詞。
想當(dāng)年盤古初開天地...額不是类溢,當(dāng)年晴空一道霹靂钥飞,PVC里蹦出來一個(gè)強(qiáng)弱分類器等價(jià)問題莺掠。揭開了弱分類器向強(qiáng)分類器起義進(jìn)軍的光輝歷史。
Cascade代承,一個(gè)一開始盯了半天也沒弄明白的單詞汁蝶。
網(wǎng)絡(luò)里有他,數(shù)據(jù)庫里有他论悴,電路里也有他掖棉,現(xiàn)在機(jī)器學(xué)習(xí)里也看見了他。每個(gè)都不一樣膀估,但好像又有些聯(lián)系……
當(dāng)AdaBoost遇見Cascade幔亥,又會(huì)碰撞出什么樣奇怪的小火花。
1 - 以Haar為始
找到一種方法察纯,劃分一個(gè)東西帕棉。你會(huì)怎么做针肥?
看著上面這一大堆黑白塊,我想應(yīng)該不難理解矩形特征這個(gè)詞——黑白兩部分嘛香伴。規(guī)則不是特征慰枕,但按某個(gè)規(guī)則可以找到特征的話,當(dāng)我們有了很多很多很多規(guī)則之后……
沒錯(cuò)即纲,這就是Haar特征的思想具帮,每一個(gè)小黑白塊就是一種規(guī)則,也是一種特征低斋,也是一個(gè)分類器蜂厅。不過單獨(dú)一個(gè)這樣的分類器當(dāng)真不敢恭維,試想有啥分類能只靠一劈兩半看左右這種粗暴直接的方式區(qū)分的...
所以膊畴,他們都是弱分類器掘猿,他們能做得不多,就像戰(zhàn)場上的士兵不計(jì)其數(shù)唇跨,組合在一起卻會(huì)有意想不到的變化稠通。(一篇講解openCV中Haar特征運(yùn)用的博客)
2 - 以Boost取意
所謂Boost,促進(jìn)增援之意轻绞。把一堆準(zhǔn)確率跟隨機(jī)數(shù)差不多的弱分類器集合在一起變成一個(gè)強(qiáng)大的強(qiáng)分類器采记,這就是Boosting算法。給每一個(gè)特征證明自己的機(jī)會(huì)政勃,改變他們的地位唧龄,也改變樣本的地位。讓士兵和小怪一起進(jìn)步奸远,最終找到隱藏在人海中的英雄與Boss既棺。這之中廣為人知的一種Boost算法就是我們的AdaBoost
3 - 以AdaBoost成形
AdaBoost的原理或者實(shí)現(xiàn)并不難理解(傳送門:基于AdaBoost的分類問題 & AdaBoost算法小例),只是他寧可放過不可錯(cuò)殺還是寧可錯(cuò)殺不可放過的閾值選擇問題讓人們備受困擾懒叛。想要提高正確率就要降低閾值丸冕,錯(cuò)誤率也會(huì)變高,想要降低錯(cuò)誤率就要提高閾值薛窥,正確率也會(huì)降低胖烛。這是一個(gè)無比頭疼卻又無可奈何的問題。
既然如此诅迷,就讓Cascade出場吧佩番。這種問題,決策樹最喜歡了罢杉。
4 - 以Cascade扭轉(zhuǎn)乾坤
Cascade即為級(jí)聯(lián)趟畏,在網(wǎng)絡(luò)WAN口級(jí)聯(lián)、數(shù)據(jù)庫信息間級(jí)聯(lián)以及電路連接中的級(jí)聯(lián)等等當(dāng)中滩租,級(jí)聯(lián)都有一種隱性的意義——一種一對(duì)多的關(guān)系赋秀。
一是一種輸入利朵,一類劃分,一個(gè)觸發(fā)猎莲,一次動(dòng)作绍弟。
多是多方參與,多種途徑著洼,多個(gè)標(biāo)準(zhǔn)晌柬,多個(gè)答案。
AdaBoost解決了士兵的眾說紛紜郭脂,成為了一方名將。而級(jí)聯(lián)的出現(xiàn)澈歉,就是要集百家名說成一方之言——一次決斷展鸡,多方銘鑒。如果我能找到99.9%的目標(biāo)分類埃难,那錯(cuò)誤的分類中哪怕有50%誤入結(jié)果莹弊,20輪之后也將不足為懼:20級(jí)的級(jí)聯(lián)足夠在99.9%變成99%的過程中,把50%變成0.0001%涡尘。
這就是級(jí)聯(lián)忍弛,或者說表現(xiàn)成的決策樹。讓每一個(gè)AdaBoost出身的強(qiáng)分類器依次進(jìn)行決策考抄,被認(rèn)為是正確的就將向下傳遞细疚,錯(cuò)誤的則被直接拋棄。再配合權(quán)重改變樣本的分布川梅,訓(xùn)練疯兼,上場,一錘定音贫途。
我們的822吧彪,我們的青春
歡迎所有熱愛知識(shí)熱愛生活的朋友和822實(shí)驗(yàn)室一起成長,吃喝玩樂丢早,享受知識(shí)姨裸。