最近在看NTU林軒田的《機(jī)器學(xué)習(xí)基石》課程,個(gè)人感覺講的非常好策彤。整個(gè)基石課程分成四個(gè)部分:
When Can Machine Learn?
Why Can Machine Learn?
How Can Machine Learn?
How Can Machine Learn Better?
每個(gè)部分由四節(jié)課組成栓袖,總共有16節(jié)課鸵闪。那么怀愧,從這篇開始怔昨,我們將連續(xù)對(duì)這門課做課程筆記独旷,共16篇署穗,希望能對(duì)正在看這們課的童鞋有所幫助。下面開始第一節(jié)課的筆記:The Learning Problem嵌洼。
一案疲、What is Machine Learning
什么是“學(xué)習(xí)”?學(xué)習(xí)就是人類通過觀察麻养、積累經(jīng)驗(yàn)褐啡,掌握某項(xiàng)技能或能力。就好像我們從小學(xué)習(xí)識(shí)別字母鳖昌、認(rèn)識(shí)漢字备畦,就是學(xué)習(xí)的過程。而機(jī)器學(xué)習(xí)(Machine Learning)许昨,顧名思義懂盐,就是讓機(jī)器(計(jì)算機(jī))也能向人類一樣,通過觀察大量的數(shù)據(jù)和訓(xùn)練糕档,發(fā)現(xiàn)事物規(guī)律莉恼,獲得某種分析問題、解決問題的能力速那。
機(jī)器學(xué)習(xí)可以被定義為:Improving some performance measure with experence computed from data. 也就是機(jī)器從數(shù)據(jù)中總結(jié)經(jīng)驗(yàn)俐银,從數(shù)據(jù)中找出某種規(guī)律或者模型,并用它來解決實(shí)際問題端仰。
什么情況下會(huì)使用機(jī)器學(xué)習(xí)來解決問題呢捶惜?其實(shí),目前機(jī)器學(xué)習(xí)的應(yīng)用非常廣泛榆俺,基本上任何場(chǎng)合都能夠看到它的身影售躁。其應(yīng)用場(chǎng)合大致可歸納為三個(gè)條件:
事物本身存在某種潛在規(guī)律
某些問題難以使用普通編程解決
有大量的數(shù)據(jù)樣本可供使用
二坞淮、Applications of Machine Learning
機(jī)器學(xué)習(xí)在我們的衣茴晋、食、住回窘、行诺擅、教育、娛樂等各個(gè)方面都有著廣泛的應(yīng)用啡直,我們的生活處處都離不開機(jī)器學(xué)習(xí)烁涌。比如苍碟,打開購物網(wǎng)站,網(wǎng)站就會(huì)給我們自動(dòng)推薦我們可能會(huì)喜歡的商品撮执;電影頻道會(huì)根據(jù)用戶的瀏覽記錄和觀影記錄微峰,向不同用戶推薦他們可能喜歡的電影等等,到處都有機(jī)器學(xué)習(xí)的影子抒钱。
三蜓肆、Components of Machine Learning
本系列的課程對(duì)機(jī)器學(xué)習(xí)問題有一些基本的術(shù)語需要注意一下:
輸入x
輸出y
目標(biāo)函數(shù)f,即最接近實(shí)際樣本分布的規(guī)律
訓(xùn)練樣本data
假設(shè)hypothesis谋币,一個(gè)機(jī)器學(xué)習(xí)模型對(duì)應(yīng)了很多不同的hypothesis仗扬,通過演算法A,選擇一個(gè)最佳的hypothesis對(duì)應(yīng)的函數(shù)稱為矩g蕾额,g能最好地表示事物的內(nèi)在規(guī)律早芭,也是我們最終想要得到的模型表達(dá)式。
實(shí)際中诅蝶,機(jī)器學(xué)習(xí)的流程圖可以表示為:
對(duì)于理想的目標(biāo)函數(shù)f退个,我們是不知道的,我們手上拿到的是一些訓(xùn)練樣本D调炬,假設(shè)是監(jiān)督式學(xué)習(xí)帜乞,其中有輸入x,也有輸出y筐眷。機(jī)器學(xué)習(xí)的過程黎烈,就是根據(jù)先驗(yàn)知識(shí)選擇模型,該模型對(duì)應(yīng)的hypothesis set(用H表示)匀谣,H中包含了許多不同的hypothesis照棋,通過演算法A,在訓(xùn)練樣本D上進(jìn)行訓(xùn)練武翎,選擇出一個(gè)最好的hypothes烈炭,對(duì)應(yīng)的函數(shù)表達(dá)式g就是我們最終要求的。一般情況下宝恶,g能最接近目標(biāo)函數(shù)f符隙,這樣,機(jī)器學(xué)習(xí)的整個(gè)流程就完成了垫毙。
四霹疫、Machine Learning and Other Fields
與機(jī)器學(xué)習(xí)相關(guān)的領(lǐng)域有:
數(shù)據(jù)挖掘(Data Mining)
人工智能(Artificial Intelligence)
統(tǒng)計(jì)(Statistics)
其實(shí),機(jī)器學(xué)習(xí)與這三個(gè)領(lǐng)域是相通的综芥,基本類似丽蝎,但也不完全一樣。機(jī)器學(xué)習(xí)是這三個(gè)領(lǐng)域中的有力工具膀藐,而同時(shí)屠阻,這三個(gè)領(lǐng)域也是機(jī)器學(xué)習(xí)可以廣泛應(yīng)用的領(lǐng)域红省,總得來說,他們之間沒有十分明確的界線国觉。
五吧恃、總結(jié)
本節(jié)課主要介紹了什么是機(jī)器學(xué)習(xí),什么樣的場(chǎng)合下可以使用機(jī)器學(xué)習(xí)解決問題麻诀,然后用流程圖的形式展示了機(jī)器學(xué)習(xí)的整個(gè)過程蚜枢,最后把機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘、人工智能针饥、統(tǒng)計(jì)這三個(gè)領(lǐng)域做個(gè)比較厂抽。本節(jié)課的內(nèi)容主要是概述性的東西,比較簡(jiǎn)單丁眼,所以筆記也相對(duì)比較簡(jiǎn)略筷凤。
這里附上林軒田(Hsuan-Tien Lin)關(guān)于這門課的主頁:
http://www.csie.ntu.edu.tw/~htlin/
原文CSDN博客地址:
http://blog.csdn.net/red_stone1/article/details/72899485
注明:
文章中所有的圖片均來自NTU林軒田《機(jī)器學(xué)習(xí)基石課程》