機器學習 西瓜書 Day22 規(guī)則學習

p347 - p371
前幾天休刊了痒钝,今天回來了= =
進入第15章

第15章 規(guī)則學習模型

15.1 基本概念

“規(guī)則”通常指語義明確,能描述數(shù)據分布隱含的客觀規(guī)律或領域概念筹我,可寫成“若..則..”赂苗。

與其他黑箱模型相比,規(guī)則學習具有更好的可解釋性渗蟹。
絕大多數(shù)人類知識都能通過數(shù)理邏輯來進行刻畫块饺,因此便于引進領域知識耻陕。

符合一條規(guī)則的樣本稱為被該規(guī)則“覆蓋”

當同一個示例被判別結果不同的多條規(guī)則覆蓋時刨沦,稱發(fā)生了沖突
解決沖突的方法稱為沖突消解膘怕,包括投票法想诅、排序法、元規(guī)則法岛心。

一般都要設置默認規(guī)則来破,來處理規(guī)則集合未覆蓋的樣本。

命題規(guī)則VS一階規(guī)則(關系型規(guī)則) p348

15.2 序貫覆蓋

規(guī)則學習最直接的做法是“序貫覆蓋”忘古,即逐條歸納徘禁。
每學到一條規(guī)則,就將該規(guī)則覆蓋的樣本去掉髓堪,以剩下的樣例繼續(xù)訓練送朱。
由于每次只處理一部分數(shù)據,所以也被稱為“分治”策略干旁。

基于窮盡搜索的做法
例子:p350驶沼。

但現(xiàn)實中會因為組合爆炸而不可行。
通常有兩種策略:
自頂向下(生成-測試) vs 自底向上(數(shù)據驅動)

前者是從一般的規(guī)則開始争群,逐漸添加新文字回怜,是規(guī)則逐漸“特化”的過程
更容易產生泛化性能較好的規(guī)則。
對噪聲魯棒性強换薄。
例子p351-352玉雾。
可每次采用多個最優(yōu)文字來避免過于貪心。

后者是從特殊的規(guī)則開始轻要,減少文字复旬,是“泛化”的過程。
更適用于訓練樣本較少冲泥。

15.3 剪枝優(yōu)化

規(guī)則生成本質是一個貪心搜索過程赢底,需要緩解過擬合。
最常見做法是剪枝

預剪枝 vs 后剪枝

CN2算法的預剪枝柏蘑。借助了統(tǒng)計性檢驗幸冻。

REP的后剪枝,O(m^4)咳焚。
IREP O(m log^2 m)
著名的規(guī)則學習算法 RIPPER 后處理機制洽损,將R中所有規(guī)則再進行一次優(yōu)化,就是通過全局的考慮來緩解了貪心算法的局部性革半。

15.4 一階規(guī)則學習

通常很難定義屬性值。
因此可以采用“色澤更深(2虾攻,1)行施、更好(2,1)”這樣的表述方式漫试。

色澤更深 這樣的原子公式稱為“背景知識”
更好 這樣由樣本類別轉化而來的原子公式稱為“關系數(shù)據樣例”

一階學習能容易的引入領域知識,是相比命題學習的一大優(yōu)勢碘赖。

在命題規(guī)則學習乃至一般的統(tǒng)計學習中驾荣,引入領域知識通常有兩種做法:
1)通過領域知識構造新屬性。
2)基于領域知識設計某種函數(shù)機制(如正則化)來對假設空間進行約束普泡。

FOIL算法:著名的一階規(guī)則學習算法播掷。
遵循序貫覆蓋并采用自頂向下的歸納策略。
并采用后剪枝進行優(yōu)化撼班。
使用FOIL增益來選擇文字歧匈。

15.5 歸納邏輯程序設計(ILP)

在一階學習中引入了函數(shù)和邏輯表達式嵌套
容易看到這樣就不能自頂向上了,因為無法窮舉砰嘁。

15.5.1 最小一般泛化(LGG)

ILP都采用自底向上的策略件炉。
如何把特殊規(guī)則轉化為一般規(guī)則?
最基礎的技術是LGG
舉例:p358 - p359

15.5.2 逆歸結

歸結原理:一階謂詞演算中的演繹推理能用一條十分簡潔的規(guī)則描述矮湘。
可將復雜的邏輯規(guī)則和背景知識聯(lián)系起來化繁為簡

逆歸結:能基于背景知識來發(fā)明新的概念和關系

p360-p363 具體過程有些抽象
逆歸結的一大特點是可以自動發(fā)明新謂詞妻率,這些新謂詞可能對應于一些新知識。

15.6 閱讀材料

規(guī)則學習是符號主義學習的主要代表板祝。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末宫静,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子券时,更是在濱河造成了極大的恐慌孤里,老刑警劉巖,帶你破解...
    沈念sama閱讀 210,978評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件橘洞,死亡現(xiàn)場離奇詭異捌袜,居然都是意外死亡,警方通過查閱死者的電腦和手機炸枣,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評論 2 384
  • 文/潘曉璐 我一進店門虏等,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人适肠,你說我怎么就攤上這事霍衫。” “怎么了侯养?”我有些...
    開封第一講書人閱讀 156,623評論 0 345
  • 文/不壞的土叔 我叫張陵敦跌,是天一觀的道長。 經常有香客問我逛揩,道長柠傍,這世上最難降的妖魔是什么麸俘? 我笑而不...
    開封第一講書人閱讀 56,324評論 1 282
  • 正文 為了忘掉前任,我火速辦了婚禮惧笛,結果婚禮上从媚,老公的妹妹穿的比我還像新娘。我一直安慰自己患整,他們只是感情好拜效,可當我...
    茶點故事閱讀 65,390評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著并级,像睡著了一般。 火紅的嫁衣襯著肌膚如雪侮腹。 梳的紋絲不亂的頭發(fā)上嘲碧,一...
    開封第一講書人閱讀 49,741評論 1 289
  • 那天,我揣著相機與錄音父阻,去河邊找鬼愈涩。 笑死,一個胖子當著我的面吹牛加矛,可吹牛的內容都是我干的履婉。 我是一名探鬼主播,決...
    沈念sama閱讀 38,892評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼斟览,長吁一口氣:“原來是場噩夢啊……” “哼毁腿!你這毒婦竟也來了?” 一聲冷哼從身側響起苛茂,我...
    開封第一講書人閱讀 37,655評論 0 266
  • 序言:老撾萬榮一對情侶失蹤已烤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后妓羊,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體胯究,經...
    沈念sama閱讀 44,104評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年躁绸,在試婚紗的時候發(fā)現(xiàn)自己被綠了裕循。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,569評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡净刮,死狀恐怖剥哑,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情淹父,我是刑警寧澤星持,帶...
    沈念sama閱讀 34,254評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站弹灭,受9級特大地震影響督暂,放射性物質發(fā)生泄漏揪垄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,834評論 3 312
  • 文/蒙蒙 一逻翁、第九天 我趴在偏房一處隱蔽的房頂上張望饥努。 院中可真熱鬧,春花似錦八回、人聲如沸酷愧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,725評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽溶浴。三九已至,卻和暖如春管引,著一層夾襖步出監(jiān)牢的瞬間士败,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,950評論 1 264
  • 我被黑心中介騙來泰國打工褥伴, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留谅将,地道東北人。 一個月前我還...
    沈念sama閱讀 46,260評論 2 360
  • 正文 我出身青樓重慢,卻偏偏與公主長得像饥臂,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子似踱,可洞房花燭夜當晚...
    茶點故事閱讀 43,446評論 2 348

推薦閱讀更多精彩內容