最近在看NTU林軒田的《機(jī)器學(xué)習(xí)基石》課程,整個(gè)基石課程分成四個(gè)部分:
When Can Machine Learn?
Why Can Machine Learn?
How Can Machine Learn?
How Can Machine Learn Better?
每個(gè)部分由四節(jié)課組成贰谣,總共有16節(jié)課。那么穷遂,從這篇開始突颊,我們將連續(xù)對(duì)這門課做課程筆記,共16篇,希望能對(duì)正在看這們課的童鞋有所幫助文黎。下面開始第一節(jié)課的筆記:The Learning Problem七冲。
一痛倚、What is Machine Learning
什么是“學(xué)習(xí)”?學(xué)習(xí)就是人類通過觀察澜躺、積累經(jīng)驗(yàn)蝉稳,掌握某項(xiàng)技能或能力。就好像我們從小學(xué)習(xí)識(shí)別字母掘鄙、認(rèn)識(shí)漢字耘戚,就是學(xué)習(xí)的過程。而機(jī)器學(xué)習(xí)(Machine Learning)通铲,顧名思義毕莱,就是讓機(jī)器(計(jì)算機(jī))也能向人類一樣,通過觀察大量的數(shù)據(jù)和訓(xùn)練颅夺,發(fā)現(xiàn)事物規(guī)律朋截,獲得某種分析問題、解決問題的能力吧黄。
機(jī)器學(xué)習(xí)可以被定義為:Improving some performance measure with experence computed from data. 也就是機(jī)器從數(shù)據(jù)中總結(jié)經(jīng)驗(yàn)部服,從數(shù)據(jù)中找出某種規(guī)律或者模型,并用它來解決實(shí)際問題拗慨。
什么情況下會(huì)使用機(jī)器學(xué)習(xí)來解決問題呢廓八?其實(shí),目前機(jī)器學(xué)習(xí)的應(yīng)用非常廣泛赵抢,基本上任何場(chǎng)合都能夠看到它的身影剧蹂。其應(yīng)用場(chǎng)合大致可歸納為三個(gè)條件:
事物本身存在某種潛在規(guī)律
某些問題難以使用普通編程解決
-
有大量的數(shù)據(jù)樣本可供使用
image.png
二、Applications of Machine Learning
機(jī)器學(xué)習(xí)在我們的衣烦却、食宠叼、住、行、教育冒冬、娛樂等各個(gè)方面都有著廣泛的應(yīng)用伸蚯,我們的生活處處都離不開機(jī)器學(xué)習(xí)。比如简烤,打開購(gòu)物網(wǎng)站剂邮,網(wǎng)站就會(huì)給我們自動(dòng)推薦我們可能會(huì)喜歡的商品;電影頻道會(huì)根據(jù)用戶的瀏覽記錄和觀影記錄横侦,向不同用戶推薦他們可能喜歡的電影等等挥萌,到處都有機(jī)器學(xué)習(xí)的影子。
三枉侧、Components of Machine Learning
本系列的課程對(duì)機(jī)器學(xué)習(xí)問題有一些基本的術(shù)語需要注意一下:
輸入x
輸出y
目標(biāo)函數(shù)f瑞眼,即最接近實(shí)際樣本分布的規(guī)律
訓(xùn)練樣本data
-
假設(shè)hypothesis,一個(gè)機(jī)器學(xué)習(xí)模型對(duì)應(yīng)了很多不同的hypothesis棵逊,通過演算法A伤疙,選擇一個(gè)最佳的hypothesis對(duì)應(yīng)的函數(shù)稱為矩g,g能最好地表示事物的內(nèi)在規(guī)律辆影,也是我們最終想要得到的模型表達(dá)式徒像。
image.png
實(shí)際中,機(jī)器學(xué)習(xí)的流程圖可以表示為:
對(duì)于理想的目標(biāo)函數(shù)f蛙讥,我們是不知道的锯蛀,我們手上拿到的是一些訓(xùn)練樣本D,假設(shè)是監(jiān)督式學(xué)習(xí)次慢,其中有輸入x旁涤,也有輸出y。機(jī)器學(xué)習(xí)的過程迫像,就是根據(jù)先驗(yàn)知識(shí)選擇模型劈愚,該模型對(duì)應(yīng)的hypothesis set(用H表示),H中包含了許多不同的hypothesis闻妓,通過演算法A菌羽,在訓(xùn)練樣本D上進(jìn)行訓(xùn)練,選擇出一個(gè)最好的hypothes由缆,對(duì)應(yīng)的函數(shù)表達(dá)式g就是我們最終要求的注祖。一般情況下,g能最接近目標(biāo)函數(shù)f均唉,這樣是晨,機(jī)器學(xué)習(xí)的整個(gè)流程就完成了。
四舔箭、Machine Learning and Other Fields
與機(jī)器學(xué)習(xí)相關(guān)的領(lǐng)域有:
數(shù)據(jù)挖掘(Data Mining)
人工智能(Artificial Intelligence)
統(tǒng)計(jì)(Statistics)
其實(shí)罩缴,機(jī)器學(xué)習(xí)與這三個(gè)領(lǐng)域是相通的,基本類似,但也不完全一樣靴庆。機(jī)器學(xué)習(xí)是這三個(gè)領(lǐng)域中的有力工具,而同時(shí)怒医,這三個(gè)領(lǐng)域也是機(jī)器學(xué)習(xí)可以廣泛應(yīng)用的領(lǐng)域炉抒,總得來說,他們之間沒有十分明確的界線稚叹。
五焰薄、總結(jié)
本節(jié)課主要介紹了什么是機(jī)器學(xué)習(xí),什么樣的場(chǎng)合下可以使用機(jī)器學(xué)習(xí)解決問題扒袖,然后用流程圖的形式展示了機(jī)器學(xué)習(xí)的整個(gè)過程塞茅,最后把機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘、人工智能季率、統(tǒng)計(jì)這三個(gè)領(lǐng)域做個(gè)比較野瘦。本節(jié)課的內(nèi)容主要是概述性的東西,比較簡(jiǎn)單飒泻,所以筆記也相對(duì)比較簡(jiǎn)略鞭光。
這里附上林軒田(Hsuan-Tien Lin)關(guān)于這門課的主頁(yè):
http://www.csie.ntu.edu.tw/~htlin/
注明:
文章中所有的圖片均來自臺(tái)灣大學(xué)林軒田《機(jī)器學(xué)習(xí)基石》課程。