《數(shù)據(jù)挖掘?qū)д摗稢H5.1基于規(guī)則的分類器-讀書筆記(2)

5.1基于規(guī)則的分類器

形式:規(guī)則-預(yù)測類 if-then(和決策樹區(qū)別,決策樹規(guī)則有總分,規(guī)則分類是平行的,但是它倆可以轉(zhuǎn)換)

5.1.1原理:

1.互斥規(guī)則:一條記錄不能出現(xiàn)多個(gè)預(yù)測類,避免多個(gè)類出現(xiàn)的方法有:有序規(guī)則(規(guī)則按優(yōu)先降序排列)和無序規(guī)則(產(chǎn)生多個(gè)預(yù)測類变逃,進(jìn)行加權(quán)計(jì)票)

2.窮舉規(guī)則:每天記錄都應(yīng)有預(yù)測類必逆,不行就整一個(gè)其他類

5.1.2規(guī)則的排序方案:

1.基于規(guī)則排序:秩越前怠堪,越容易被解釋,秩越低的規(guī)則越難被解釋

2.基于類排序:屬于同一類的規(guī)則一起出現(xiàn)

5.1.3如何建立基于規(guī)則的分類器:

1.直接方法(5.1.4)? ?2.間接方法(5.1.5)

5.1.4規(guī)則提取的直接方法

順序覆蓋:規(guī)則基于某種評估度量以貪心的方式增長名眉。

1.learn-one-rule函數(shù):原理-建立-評價(jià)

(1)原理:該函數(shù)的目標(biāo)是提取一個(gè)分類規(guī)則粟矿,該規(guī)則涵蓋訓(xùn)練集中大量正例,沒有或僅覆蓋少量反例损拢。

(2)建立:它先產(chǎn)生一個(gè)初始規(guī)則r陌粹,并不斷對該規(guī)則球精,直到滿足某種終止條件為止福压。然后修剪該規(guī)則掏秩,改進(jìn)泛化誤差或舞。

(3)規(guī)則增長策略:

-從特殊到一般:以一個(gè)正例為初始種子,刪除合取向泛化規(guī)則蒙幻,直到覆蓋反例停止映凳。

-從一般到特殊:以空集規(guī)則開始,不斷加入合取向邮破,反例減少诈豌,直到無反例被覆蓋。

(4)規(guī)則評估:同時(shí)考慮準(zhǔn)確率和覆蓋率抒和,可用:似然比統(tǒng)計(jì)量矫渔、Laplace度量、FOIL信息增益進(jìn)行評價(jià)摧莽。

(5)規(guī)則剪枝:4.4

2.順序覆蓋基本原理

規(guī)則提取出來之后庙洼,順序覆蓋算法必須要?jiǎng)h除該規(guī)則所覆蓋的所有正例和反例。

3.RIPPER算法:合取向-規(guī)則-規(guī)則集

規(guī)則增長策略:從一般到特殊镊辕,使用信息增益來選擇最佳的合取項(xiàng)送膳,規(guī)則開始覆蓋反例時(shí)停止加入合取項(xiàng)。利用準(zhǔn)確率進(jìn)行剪枝丑蛤。

建立規(guī)則集:規(guī)則生成后叠聋,刪除其所覆蓋的正例和反例,若規(guī)則在確認(rèn)集上的錯(cuò)誤率低于0.5受裹,則終止加入新規(guī)則碌补。

5.1.5規(guī)則提取的間接方法:

從其他分類模型中提取規(guī)則(此節(jié)已決策樹模型為例)

1.規(guī)則產(chǎn)生:每一條路徑就是一個(gè)規(guī)則,簡化規(guī)則棉饶,規(guī)則剪枝厦章。

2.規(guī)則排序:將同一類標(biāo)號(hào)的規(guī)則放在一個(gè)規(guī)則子集中,計(jì)算子集的長度照藻,按照長度由小到大進(jìn)行排序袜啃,構(gòu)成規(guī)則集。子集長度=L+g*L’

5.1.6基于規(guī)則的分類器的特征:

與決策樹非常類似幸缕,能夠產(chǎn)生易于解釋的描述性模型群发。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市发乔,隨后出現(xiàn)的幾起案子熟妓,更是在濱河造成了極大的恐慌,老刑警劉巖栏尚,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件起愈,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)抬虽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進(jìn)店門官觅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人阐污,你說我怎么就攤上這事缰猴。” “怎么了疤剑?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵滑绒,是天一觀的道長。 經(jīng)常有香客問我隘膘,道長疑故,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任弯菊,我火速辦了婚禮纵势,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘管钳。我一直安慰自己钦铁,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布才漆。 她就那樣靜靜地躺著牛曹,像睡著了一般。 火紅的嫁衣襯著肌膚如雪醇滥。 梳的紋絲不亂的頭發(fā)上黎比,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天,我揣著相機(jī)與錄音鸳玩,去河邊找鬼阅虫。 笑死,一個(gè)胖子當(dāng)著我的面吹牛不跟,可吹牛的內(nèi)容都是我干的颓帝。 我是一名探鬼主播,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼窝革,長吁一口氣:“原來是場噩夢啊……” “哼购城!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起聊闯,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤工猜,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后菱蔬,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年拴泌,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了魏身。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,664評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蚪腐,死狀恐怖箭昵,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情回季,我是刑警寧澤家制,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站泡一,受9級(jí)特大地震影響颤殴,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜鼻忠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一涵但、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧帖蔓,春花似錦矮瘟、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至埋酬,卻和暖如春埋涧,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背奇瘦。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工棘催, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人耳标。 一個(gè)月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓醇坝,卻偏偏與公主長得像,于是被迫代替她去往敵國和親次坡。 傳聞我的和親對象是個(gè)殘疾皇子呼猪,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,554評論 2 349