機(jī)器學(xué)習(xí)(1)

本章節(jié)是對我學(xué)習(xí)完機(jī)器學(xué)習(xí)(周志華)第一章 所做出來的總結(jié)

第一章緒論

1.1 引言

機(jī)器學(xué)習(xí)的定義:致力于如何通過計算的手段,利用經(jīng)驗來改善系統(tǒng)自身的性能窜管。

機(jī)器學(xué)習(xí)所研究的主要內(nèi)容怠惶,是關(guān)于在計算機(jī)上從數(shù)據(jù)中產(chǎn)生“模型”的算法酬凳,也就是“學(xué)習(xí)算法”取募。

1.2 基本術(shù)語

數(shù)據(jù)集:由數(shù)據(jù)組成的集合壮吩。有時整個數(shù)據(jù)集也可稱為一個“樣本”不皆,因為它可看作對樣本空間的一個采樣贯城。

樣本:數(shù)據(jù)集中每條記錄關(guān)于一個事件或?qū)ο蟮拿枋觯卜Q為“示例”霹娄。

樣例:擁有標(biāo)記信息的示例能犯。

屬性:反應(yīng)事件或?qū)ο笤谀撤矫娴谋憩F(xiàn)或性質(zhì)的事項,也稱為“特征”犬耻。

屬性值:屬性的取值踩晶。

屬性空間:屬性張成的空間,也稱為“樣本空間”或“輸入空間”香追。

學(xué)習(xí):從數(shù)據(jù)中學(xué)得模型的過程合瓢,也稱為“訓(xùn)練”。這個過程通過執(zhí)行某個學(xué)習(xí)算法來完成透典。

訓(xùn)練數(shù)據(jù):訓(xùn)練過程中使用的數(shù)據(jù)晴楔。

訓(xùn)練樣本:訓(xùn)練數(shù)據(jù)中的每個樣本。

訓(xùn)練集:訓(xùn)練樣本組成的集合峭咒。

分類:預(yù)測的是離散值税弃,例如:“好瓜” “壞瓜”。

回歸:預(yù)測的是連續(xù)值凑队,例如西瓜的成熟度0.95则果、0.37。

聚類:將訓(xùn)練集中的西瓜分為若干組漩氨,每組稱為一個“簇”西壮;這些自動形成的簇可能對應(yīng)一些潛在的概念劃分,例如“淺色瓜” “深色瓜”叫惊,甚至“本地瓜” “外地瓜”款青。

在聚類學(xué)習(xí)中,“淺色瓜” “深色瓜”這樣的概念我們事先是不知道的霍狰,而且學(xué)習(xí)過程中使用的訓(xùn)練樣本通常不擁有標(biāo)記信息抡草。

分類和聚類的區(qū)別:https://blog.csdn.net/u010412719/article/details/46726625/

監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí):根據(jù)訓(xùn)練數(shù)據(jù)可以分為監(jiān)督學(xué)習(xí)(分類饰及、回歸)和無監(jiān)督學(xué)習(xí)(聚類),也稱為有導(dǎo)師學(xué)習(xí)和無導(dǎo)師學(xué)習(xí)康震。

二分類:只涉及兩個類別燎含。一個為“正類”,一個為“反類”腿短。樣本空間——>輸出空間屏箍;輸出空間={+1,-1}或{0答姥,1}铣除。

多分類:涉及多個類別,|輸出空間|>2鹦付。

泛化能力:學(xué)得模型適用于新樣本的能力尚粘。機(jī)器學(xué)習(xí)的目標(biāo)是使學(xué)得的模型能很好地適用于“新樣本”,而不是僅僅在訓(xùn)練樣本上工作得很好敲长;即便對聚類這樣的無監(jiān)督學(xué)習(xí)任務(wù)郎嫁,也希望學(xué)得的簇劃分能適用于沒在訓(xùn)練集中出現(xiàn)的樣本。

1.3 假設(shè)空間

歸納學(xué)習(xí)有廣義和狹義之分祈噪。

廣義的歸納學(xué)習(xí):從樣例中學(xué)習(xí)泽铛。

狹義的歸納學(xué)習(xí):從訓(xùn)練數(shù)據(jù)中學(xué)得概念,因此又稱為“概念學(xué)習(xí)”或“概念形成”辑鲤。

概念學(xué)習(xí)中最基本的是布爾概念學(xué)習(xí)盔腔,即對“是” “不是”這樣的可表示為0/1布爾值的目標(biāo)概念的學(xué)習(xí)。

假設(shè)空間:由所有假設(shè)組成的空間月褥。這里我們由“色澤” “根蒂” “敲聲”組成假設(shè)空間弛随,分別有3、3宁赤、3種可能取值舀透,則假設(shè)空間的規(guī)模大小為:4*4*4+1=65,圖中*代表任意值


西瓜問題的假設(shè)空間

1.4 歸納偏好

歸納偏好:機(jī)器學(xué)算法在學(xué)習(xí)過程中對某種類型假設(shè)的偏好决左。

任何一個有效的機(jī)器學(xué)習(xí)算法必有其歸納偏好愕够,否則它將被假設(shè)空間中看似在訓(xùn)練集上“等效”的假設(shè)所迷惑,而無法產(chǎn)生確定的學(xué)習(xí)結(jié)果佛猛。如沒有偏好每個假設(shè)都是等效的惑芭,那么對于一個新瓜,學(xué)得模型時而說是好瓜继找、時而說是壞瓜强衡,這樣的結(jié)果明顯沒有意義。

可用“奧卡姆剃刀”來引導(dǎo)算法確立“正確”的偏好。

奧卡姆剃刀原則:如多個假設(shè)與觀察一致漩勤,則選用最簡單那個。

如果采用奧卡姆剃刀原則缩搅,并且假設(shè)“更平滑”則“更簡單”越败,那么在下圖中,我們會自然的偏好“平滑”的曲線A硼瓣。


存在多條曲線與有限樣本訓(xùn)練集一致

“沒有免費的午餐”定理(簡稱NFL定理):對于一個學(xué)習(xí)算法A究飞,若它在某些問題上比學(xué)習(xí)算法B好,則必然存在另一些問題堂鲤,在那里算法B會比算法A好亿傅。這個結(jié)論對任何算法都成立。也就是說無論學(xué)習(xí)算法A多聰明瘟栖、學(xué)習(xí)算法B多笨拙葵擎,它們的期望性能都相同。


沒有免費的午餐(黑點:訓(xùn)練樣本半哟;白點:測試樣本)

NFL定理最重要的寓意是讓我們清楚地認(rèn)識到酬滤,脫離具體問題,空乏地談?wù)摗笆裁磳W(xué)習(xí)算法更好”毫無意義寓涨。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末盯串,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子戒良,更是在濱河造成了極大的恐慌体捏,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件糯崎,死亡現(xiàn)場離奇詭異几缭,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)拇颅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進(jìn)店門奏司,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人樟插,你說我怎么就攤上這事韵洋。” “怎么了?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵改化,是天一觀的道長度陆。 經(jīng)常有香客問我,道長副编,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任流强,我火速辦了婚禮痹届,結(jié)果婚禮上呻待,老公的妹妹穿的比我還像新娘。我一直安慰自己队腐,他們只是感情好蚕捉,可當(dāng)我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著柴淘,像睡著了一般迫淹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上为严,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天敛熬,我揣著相機(jī)與錄音,去河邊找鬼第股。 笑死应民,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的炸茧。 我是一名探鬼主播瑞妇,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼梭冠!你這毒婦竟也來了辕狰?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤控漠,失蹤者是張志新(化名)和其女友劉穎蔓倍,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體盐捷,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡偶翅,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了碉渡。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片聚谁。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖滞诺,靈堂內(nèi)的尸體忽然破棺而出形导,到底是詐尸還是另有隱情,我是刑警寧澤习霹,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布朵耕,位于F島的核電站,受9級特大地震影響淋叶,放射性物質(zhì)發(fā)生泄漏阎曹。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望处嫌。 院中可真熱鬧栅贴,春花似錦、人聲如沸锰霜。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽癣缅。三九已至,卻和暖如春哄酝,著一層夾襖步出監(jiān)牢的瞬間友存,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工陶衅, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留屡立,地道東北人。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓搀军,卻偏偏與公主長得像膨俐,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子罩句,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內(nèi)容