二戰(zhàn)周志華《機(jī)器學(xué)習(xí)》--特征選擇

1嫌变、子集搜索與評價

我們能用很多屬性描述一個西瓜吨艇,例如色澤、根蒂腾啥、敲聲东涡、紋理等等。但有經(jīng)驗的人往往只需看根蒂倘待,聽聽敲聲就可以知道是否是好瓜疮跑,換言之,對于一個學(xué)習(xí)任務(wù)來說凸舵,給定屬性集祖娘,其中有些屬性可能很關(guān)鍵,而另一些則可能沒什么用啊奄,我們將這些屬性稱為特征的話渐苏,對當(dāng)前學(xué)習(xí)任務(wù)有用的特征稱為相關(guān)特征掀潮,而沒什么用的特征稱為無關(guān)特征,從給定的特征集選擇特征的過程整以,稱為特征選擇

為什么要進(jìn)行特征選擇呢胧辽?有兩個重要的原因,一個是避免維數(shù)災(zāi)難問題公黑,另一個是邑商,去除不相關(guān)的特征往往會降低學(xué)習(xí)任務(wù)的難度。

如果想從初始的特征集合中選取一個包含了所有重要信息的特征子集凡蚜,若沒有任何領(lǐng)域作為先驗知識人断,那就只好遍歷所有可能的子集了,然而這在計算上是不可能的朝蜘,特征個數(shù)稍多就無法進(jìn)行恶迈,可行的方法是產(chǎn)生一個候選子集,判斷它的好壞谱醇,基于評價結(jié)果產(chǎn)生下一個候選特征子集暇仲。顯然,有兩個環(huán)節(jié)需要注意:如何根據(jù)評價結(jié)果選取下一個子集副渴?如何評價特征子集的好壞奈附?

將特征子集搜索機(jī)制和子集評價機(jī)制相結(jié)合,即可得到特征選擇方法煮剧,例如將前向搜索與信息熵相結(jié)合斥滤,這顯然與決策樹算法非常相似。常見的特征選擇方法大致可分為三類:過濾式勉盅、包裹式和嵌入式

2佑颇、過濾式選擇

過濾式方法先對數(shù)據(jù)集進(jìn)行特張選擇,然后再訓(xùn)練學(xué)習(xí)器草娜,特征選擇過程與后續(xù)學(xué)習(xí)器無關(guān)挑胸,這相當(dāng)于先用特征選擇過程對初識特征進(jìn)行“過濾”,然后再用過濾后的特征來訓(xùn)練模型宰闰。

Relief方法

3嗜暴、包裹式選擇

包裹式選擇特征不考慮后續(xù)學(xué)習(xí)器不同,包裹式特征選擇直接把最終將要使用的學(xué)習(xí)器的性能作為特征子集的評價準(zhǔn)則议蟆。換言之,包裹式特征選擇的目的就是為給定學(xué)習(xí)器選擇最有利于其性能萎战,量身定做的特征子集咐容。包裹式選擇比過濾式特征選擇更好,但是另一方面蚂维,計算開銷卻要大得多戳粒。

LVW方法

4路狮、嵌入式選擇與L1正則化

嵌入式特征選擇是將特征選擇過程與學(xué)習(xí)器訓(xùn)練過程融為一體,兩者在同一個優(yōu)化過程中優(yōu)化蔚约,即在學(xué)習(xí)器訓(xùn)練過程中自動進(jìn)行了特征選擇奄妨。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市苹祟,隨后出現(xiàn)的幾起案子砸抛,更是在濱河造成了極大的恐慌,老刑警劉巖树枫,帶你破解...
    沈念sama閱讀 212,029評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件直焙,死亡現(xiàn)場離奇詭異,居然都是意外死亡砂轻,警方通過查閱死者的電腦和手機(jī)奔誓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,395評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來搔涝,“玉大人厨喂,你說我怎么就攤上這事∽剩” “怎么了蜕煌?”我有些...
    開封第一講書人閱讀 157,570評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長抒痒。 經(jīng)常有香客問我幌绍,道長,這世上最難降的妖魔是什么故响? 我笑而不...
    開封第一講書人閱讀 56,535評論 1 284
  • 正文 為了忘掉前任傀广,我火速辦了婚禮,結(jié)果婚禮上彩届,老公的妹妹穿的比我還像新娘伪冰。我一直安慰自己,他們只是感情好樟蠕,可當(dāng)我...
    茶點故事閱讀 65,650評論 6 386
  • 文/花漫 我一把揭開白布贮聂。 她就那樣靜靜地躺著,像睡著了一般寨辩。 火紅的嫁衣襯著肌膚如雪吓懈。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,850評論 1 290
  • 那天靡狞,我揣著相機(jī)與錄音耻警,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛甘穿,可吹牛的內(nèi)容都是我干的腮恩。 我是一名探鬼主播,決...
    沈念sama閱讀 39,006評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼温兼,長吁一口氣:“原來是場噩夢啊……” “哼秸滴!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起募判,我...
    開封第一講書人閱讀 37,747評論 0 268
  • 序言:老撾萬榮一對情侶失蹤荡含,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后兰伤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體内颗,經(jīng)...
    沈念sama閱讀 44,207評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,536評論 2 327
  • 正文 我和宋清朗相戀三年敦腔,在試婚紗的時候發(fā)現(xiàn)自己被綠了均澳。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,683評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡符衔,死狀恐怖找前,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情判族,我是刑警寧澤躺盛,帶...
    沈念sama閱讀 34,342評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站形帮,受9級特大地震影響槽惫,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜辩撑,卻給世界環(huán)境...
    茶點故事閱讀 39,964評論 3 315
  • 文/蒙蒙 一界斜、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧合冀,春花似錦各薇、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,772評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至棕叫,卻和暖如春林螃,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背俺泣。 一陣腳步聲響...
    開封第一講書人閱讀 32,004評論 1 266
  • 我被黑心中介騙來泰國打工治宣, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留急侥,地道東北人。 一個月前我還...
    沈念sama閱讀 46,401評論 2 360
  • 正文 我出身青樓侮邀,卻偏偏與公主長得像,于是被迫代替她去往敵國和親贝润。 傳聞我的和親對象是個殘疾皇子绊茧,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,566評論 2 349

推薦閱讀更多精彩內(nèi)容