斯坦福大學(xué)吳恩達(dá)教授的機(jī)器學(xué)習(xí)課程堪稱經(jīng)典并鸵,參考該課程鸳粉,來和大家一起入門學(xué)習(xí)機(jī)器學(xué)習(xí)這一領(lǐng)域。
機(jī)器學(xué)習(xí)是什么园担?
不存在一個被廣泛認(rèn)可的定義
- 在進(jìn)行特定編程的情況下届谈,給予計(jì)算機(jī)學(xué)習(xí)能力的領(lǐng)域枯夜。
- 一個程序被認(rèn)為能從經(jīng)驗(yàn)E中學(xué)習(xí),解決任務(wù)T艰山,達(dá)到性能度量值P湖雹,當(dāng)且僅當(dāng),有了經(jīng)驗(yàn)E之后曙搬,經(jīng)過P評判摔吏,程序在處理T時的性能有所提升。
舉個例子:
下棋訓(xùn)練
E:程序上萬次的自我練習(xí)的經(jīng)驗(yàn)
T:下棋
P:對局時贏得比賽的概率
監(jiān)督學(xué)習(xí)
最常見的一種機(jī)器學(xué)習(xí)問題纵装。
我們給學(xué)習(xí)算法一個數(shù)據(jù)集征讲,這個數(shù)據(jù)集由“正確答案”組成。舉房子價格的例子橡娄,提供一系列房子的數(shù)據(jù)诗箍,也就是給出每個樣本的正確價格—(實(shí)際售價)然后運(yùn)用機(jī)器學(xué)習(xí)算法,算出更多的正確答案挽唉。
即回歸問題:試著推測出一個連續(xù)值的結(jié)果滤祖,即房子的價格。
分類問題
舉例:腫瘤檢測
根據(jù)腫瘤尺寸橱夭、患者年齡氨距、腫塊密度等特征來預(yù)測離散輸出桑逝,分別為良性棘劣、第一類第二類或第三類癌癥等。
支持向量機(jī):利用巧妙的數(shù)學(xué)技巧楞遏,讓計(jì)算機(jī)處理無限多個特征茬暇。
無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)中沒有任何的標(biāo)簽或者是有相同的標(biāo)簽或者就是沒標(biāo)簽。所以需要從這樣的數(shù)據(jù)集中找到某種結(jié)構(gòu)寡喝。無監(jiān)督學(xué)習(xí)算法可能會把這些數(shù)據(jù)分成兩個不同的簇---聚類算法糙俗。
聚類是無監(jiān)督學(xué)習(xí)的一種。
應(yīng)用實(shí)例:
- 用于組織大型計(jì)算機(jī)集群预鬓。對于大型的計(jì)算機(jī)集群巧骚,想解決什么樣的機(jī)器易于協(xié)同的工作,使得數(shù)據(jù)中心工作的更高效格二。
- 社交網(wǎng)絡(luò)的分析劈彪。已知朋友的信息,自動的給朋友分組顶猜。
- 市場分割沧奴。根據(jù)大型數(shù)據(jù)庫中存儲的消費(fèi)者信息,自動發(fā)現(xiàn)市場分類长窄,把顧客劃分到不同的細(xì)分市場滔吠,從而自動并更有效地銷售或不同的細(xì)分市場一起進(jìn)行銷售纲菌。
總而言之,必須讓算法從數(shù)據(jù)中發(fā)現(xiàn)一切疮绷。