林軒田機(jī)器學(xué)習(xí)基石(1):The Learning Problem

歡迎關(guān)注公眾號-AI圈終身學(xué)習(xí)辜窑。
公眾號首頁回復(fù)“機(jī)器學(xué)習(xí)”查看所有系列文章讹剔。


機(jī)器學(xué)習(xí)基石課程大概八周头岔,分為四個部分:

  • When Can Machines Learn?
  • Why Can Machines Learn?
  • How Can Machines Learn?
  • How Can Machines Learn Better?

課程主頁:
http://www.csie.ntu.edu.tw/~htlin/

本節(jié)筆記Lecture 1-The Learning Problem包含內(nèi)容如下:

  • When Can Machines Learn?(什么時候用機(jī)器學(xué)習(xí))
    • What is Machine learning(什么是機(jī)器學(xué)習(xí))
    • Applications of Machine Learning(機(jī)器學(xué)習(xí)應(yīng)用)
    • Components of Machine Learning(機(jī)器學(xué)習(xí)組成部分)
    • Machine Learning and Other Fields(機(jī)器學(xué)習(xí)和其他領(lǐng)域)

一古戴、什么是機(jī)器學(xué)習(xí)(What is Machine Learning)

機(jī)器學(xué)習(xí)和學(xué)習(xí)的異同是什么掰盘?首先學(xué)習(xí)和機(jī)器學(xué)習(xí)的共通性就是觀察摄悯,他們也有差異性。

1.1 學(xué)習(xí)的流程

學(xué)習(xí)的主體是人愧捕,人通過觀察(聽奢驯、觀、觸覺)出發(fā)次绘,經(jīng)過腦袋的內(nèi)化轉(zhuǎn)化瘪阁,變成有用的技能。流程圖如下:

image

1.2 機(jī)器學(xué)習(xí)的流程

機(jī)器學(xué)習(xí)的主體是電腦邮偎,電腦通過觀察資料(語料)管跺,經(jīng)過電腦的CPU運作,變成對電腦有用的技能禾进。流程圖如下:

image

什么是“變成有用的技能”豁跑?技能就是在某種領(lǐng)域做事靠譜,比如

  • 對于人泻云,自己的英語能力艇拍、數(shù)學(xué)能力得到了提高
  • 對于電腦狐蜕,預(yù)測股票的能力得到了提高

因此機(jī)器學(xué)習(xí)更準(zhǔn)確的定義是:
通過觀察計算有規(guī)律的數(shù)據(jù),根據(jù)某種評價指標(biāo)卸夕,提升電腦性能馏鹤。
流程圖如下:


image

1.3機(jī)器學(xué)習(xí)的三個關(guān)鍵要素

什么時候適合使用機(jī)器學(xué)習(xí),林老師總結(jié)三個關(guān)鍵要素如下:

  1. 編程定義不明確娇哆,普通編程難以完成的任務(wù)
  2. 資料數(shù)據(jù)具有某種潛藏的規(guī)律,可以學(xué)習(xí)
  3. 有關(guān)于潛藏的規(guī)律資料數(shù)據(jù)

(測試題)下面哪種情況最適合使用機(jī)器學(xué)習(xí)勃救?

  1. 預(yù)測小女孩下一次哭的時間是奇數(shù)還是偶數(shù)(No,沒有規(guī)律)
  2. 判斷一個圖是否有環(huán)(No,可以編程定義明確)
  3. 預(yù)測下一個十年地球是否會毀滅(No,沒有數(shù)據(jù))
  4. 決定是否同意給用戶辦理信用卡(Yes碍讨,有用戶歷史行為數(shù)據(jù)且難以編程解決)

二、機(jī)器學(xué)習(xí)應(yīng)用(Applications of Machine Learning)

  • 衣(Abu-Mostafa, 2012)
    • 技能:穿衣搭配推薦
    • 數(shù)據(jù):衣服銷售數(shù)字+顧客調(diào)差反饋
  • 食(Sadilek et al., 2013)
    • 技能:正確告訴餐廳食物中毒的可能性
    • 數(shù)據(jù):用戶的Twitter數(shù)據(jù)(評論的文字+餐廳地點)
  • 住(Tsanas and Xifara, 2012)
    • 技能:預(yù)測建房所需能源消耗
    • 數(shù)據(jù):歷史修建房屋的能源消耗數(shù)據(jù)
  • 行(Stalkamp et al., 2012)
    • 技能:識別交通信號
    • 數(shù)據(jù):交通信號圖片和含義數(shù)據(jù)

除此之外蒙秒,還有教育(流利說)勃黍、金融(信用卡辦理)、醫(yī)療(藥效預(yù)測)晕讲、法律(摘要)覆获、娛樂(推薦系統(tǒng))等各種行業(yè)。

二瓢省、機(jī)器學(xué)習(xí)組成部分(Components of Learning)

image

以信用卡辦理為例弄息,任務(wù)是給要用信用卡花錢的用戶辦理。機(jī)器學(xué)習(xí)組件如下:

  • 輸入X(銀行用戶數(shù)據(jù)特征勤婚,如年齡摹量、性別、工資等)
  • 輸出Y(辦卡后刷還信用卡的好壞)
  • 訓(xùn)練數(shù)據(jù)D={(x_1, y_1),(x_2, y_2),...,(x_n, y_n)}
  • 目標(biāo)函數(shù)f:x \rightarrow y(理想的函數(shù)馒胆,表示實際訓(xùn)練數(shù)據(jù)的分布規(guī)律缨称,但是未知)
  • 假設(shè)集合H(hypothesis set),我們需要通過算法學(xué)到集合中最佳的假設(shè)祝迂,其對應(yīng)的函數(shù)為g:x \rightarrow y我們希望最終的模型表達(dá)式g滿足g\approx f睦尽。

機(jī)器學(xué)習(xí)整個流程可以表示如下:


image

比如以上面的信用卡辦理為例,假設(shè)其中的hypothesis set H為:

  • h1: 年薪 > 80萬
  • h2: 欠款 > 10 萬
  • h3: 工齡 < 2年

我們的H中的假設(shè)有好有壞型雳,我們通過演算法A去選擇最好的一個作為g当凡。

因此我們在機(jī)器學(xué)習(xí)中常說的模型是 演算法A+假設(shè)集合H

我們再以預(yù)測用戶給歌曲打分(0-100分)為例纠俭,我們有:

訓(xùn)練數(shù)據(jù)D = 100萬條((userid, songid), rating)對
輸入X = 所有可能的(userid, songid)對
輸出Y = [0, 100]
假設(shè)集合H = 將用戶因素和歌曲因子相乘宁玫,并由所有可能的因素組合索引

我們以訓(xùn)練數(shù)據(jù)D為入口,通過演算法A選出H中最好的假設(shè)得到g柑晒。


image

四欧瘪、機(jī)器學(xué)習(xí)和其他領(lǐng)域(Machine Learning and Other Fields)

  • 機(jī)器學(xué)習(xí)與統(tǒng)計
image
  • 機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘
image
  • 機(jī)器學(xué)習(xí)與人工智能
image

總結(jié)來說:

  • 統(tǒng)計可以實現(xiàn)機(jī)器學(xué)習(xí)
  • 機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘相互纏繞,難以區(qū)分
  • 機(jī)器學(xué)習(xí)是實現(xiàn)人工智能的一種方式

五匙赞、總結(jié)

image

本節(jié)主要概括性的講了機(jī)器學(xué)習(xí)的方方面面佛掖,高層籠統(tǒng)妖碉,概念清晰,沒有太多技術(shù)性的東西芥被。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末欧宜,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子拴魄,更是在濱河造成了極大的恐慌冗茸,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件匹中,死亡現(xiàn)場離奇詭異夏漱,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)顶捷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進(jìn)店門挂绰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人服赎,你說我怎么就攤上這事葵蒂。” “怎么了重虑?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵践付,是天一觀的道長。 經(jīng)常有香客問我缺厉,道長荔仁,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任芽死,我火速辦了婚禮乏梁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘关贵。我一直安慰自己遇骑,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布揖曾。 她就那樣靜靜地躺著落萎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪炭剪。 梳的紋絲不亂的頭發(fā)上练链,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天,我揣著相機(jī)與錄音奴拦,去河邊找鬼媒鼓。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的绿鸣。 我是一名探鬼主播疚沐,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼潮模!你這毒婦竟也來了亮蛔?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤擎厢,失蹤者是張志新(化名)和其女友劉穎究流,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體动遭,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡芬探,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了沽损。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,711評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡循头,死狀恐怖绵估,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情卡骂,我是刑警寧澤国裳,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站全跨,受9級特大地震影響缝左,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜浓若,卻給世界環(huán)境...
    茶點故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一渺杉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧挪钓,春花似錦是越、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至馏予,卻和暖如春天梧,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背霞丧。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工呢岗, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓敷燎,卻偏偏與公主長得像暂筝,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子硬贯,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,611評論 2 353

推薦閱讀更多精彩內(nèi)容