機器學(xué)習(xí)概述

機器學(xué)習(xí)

1. 定義

學(xué)科交叉.png
流程.png
  • 機器學(xué)習(xí)是多領(lǐng)域交叉學(xué)科瑟捣,機器學(xué)習(xí)從業(yè)者需要掌握一定的編程技能陕悬、數(shù)理統(tǒng)計知識以及相應(yīng)的專業(yè)領(lǐng)域知識习柠。
  • 機器學(xué)習(xí)研究的是計算機怎樣模擬人類的學(xué)習(xí)行為疏魏,以獲取新的知識或技能,并重新組織已有的知識結(jié)構(gòu)使之不斷改善自身钳踊。
  • 簡而言之衷敌,就是計算機從數(shù)據(jù)中學(xué)習(xí)出規(guī)律和模式,以應(yīng)用在新數(shù)據(jù)上做預(yù)測的任務(wù)拓瞪。

數(shù)據(jù)(Data)缴罗、學(xué)習(xí)算法(Learning Algorithm)模型(Model)機器學(xué)習(xí)三要素祭埂,機器學(xué)習(xí)的輸入是數(shù)據(jù)(Data)面氓,學(xué)到的結(jié)果叫模型(Model)。從數(shù)據(jù)中學(xué)得模型這個過程通過執(zhí)行某個學(xué)習(xí)算法(Learning Algorithm)來完成。

學(xué)習(xí)流程.jpg

由上圖可知:假設(shè)了Ground Truth f的存在舌界,那么學(xué)習(xí)算法要做的就是找出某個映射掘譬,這個映射盡可能得接近f。在實際的訓(xùn)練過程中禀横,學(xué)習(xí)算法會有一個假設(shè)集合(Hypothesis Set屁药,記作H)粥血,這個集合包含所有候選的映射函數(shù)柏锄。學(xué)習(xí)算法做的事情就是從中選出最好的g,使得g越接近f越好复亏。

因此機器學(xué)習(xí)可定義為:A takes D and H to get g(using data to compute hypothesis g that approximates target f)趾娃。

2. 歷史

歷史.jpg

AI(人工智能)在上世紀中葉就已經(jīng)誕生,1950年缔御,一位名叫馬文·明斯基(后被人稱為“人工智能之父”)的大四學(xué)生與他的同學(xué)鄧恩·埃德蒙一起抬闷,建造了世界上第一臺神經(jīng)網(wǎng)絡(luò)計算機。這也被看做是人工智能的一個起點耕突。巧合的是笤成,同樣是在1950年,被稱為“計算機之父”的阿蘭·圖靈提出了一個舉世矚目的想法——圖靈測試眷茁。

1956年炕泳,在由達特茅斯學(xué)院舉辦的一次會議上,計算機專家約翰·麥卡錫提出了“人工智能”一詞上祈。后來培遵,這被人們看做是人工智能正式誕生的標(biāo)志。就在這次會議后不久登刺,麥卡錫從達特茅斯搬到了MIT籽腕。同年,明斯基也搬到了這里纸俭,之后兩人共同創(chuàng)建了世界上第一座人工智能實驗室——MIT AI LAB實驗室皇耗。

二十世紀80年代,機器學(xué)習(xí)成為一個獨立的科學(xué)領(lǐng)域揍很,各種機器學(xué)習(xí)技術(shù)百花初綻郎楼。機器學(xué)習(xí)是人工智能領(lǐng)域中最能夠體現(xiàn)智能的一個分支,也是發(fā)展最快的一個分支女轿。機器學(xué)習(xí)有兩大主流:

  • 符號主義學(xué)習(xí):其代表包括決策樹和基于邏輯的學(xué)習(xí)(事實上箭启,機器學(xué)習(xí)在20世紀80年代正是被視為“解決公式工程瓶頸問題的關(guān)鍵”而走上人工智能主舞臺的)。

  • 基于神經(jīng)網(wǎng)絡(luò)的連接主義學(xué)習(xí):代表性技術(shù)是支持 向量機以及更一般的“核方法”蛉迹。我們目前所說的機器學(xué)習(xí)方法傅寡,一般認為是統(tǒng)計機器學(xué)習(xí)方法。

2010年前后,隨著大數(shù)據(jù)和計算機性能的提升荐操,機器學(xué)習(xí)的新方向深度學(xué)習(xí)開始爆發(fā)芜抒。

3. 機器學(xué)習(xí)工作流程

工作流程2.png

機器學(xué)習(xí)工作流程一般分為四步:

  1. 數(shù)據(jù)預(yù)處理
  2. 機器學(xué)習(xí)、訓(xùn)練模型
  3. 模型評估
  4. 預(yù)測新數(shù)據(jù)

4. 機器學(xué)習(xí)分類

?根據(jù)訓(xùn)練數(shù)據(jù)是否有標(biāo)注托启,機器學(xué)習(xí)問題大致劃分為監(jiān)督學(xué)習(xí)(Supervised Learning)無監(jiān)督學(xué)習(xí)(Unsupervised Learning)兩大類:

  • 監(jiān)督學(xué)習(xí):每個輸入樣本都有標(biāo)注宅倒,這些標(biāo)注就像老師的標(biāo)準(zhǔn)答案一樣”監(jiān)督“著學(xué)習(xí)的過程。而監(jiān)督學(xué)習(xí)又大致分成兩類:分類(Classification)回歸(Regression)
    • 分類問題:標(biāo)注是離散值屯耸,比如用戶”點擊“和”不點擊“拐迁。如果標(biāo)注只有兩個值,則稱為二分類疗绣,如果標(biāo)注有多個值线召,則稱為多分類
    • 回歸問題:標(biāo)注是連續(xù)值多矮,比如如果問題是預(yù)測北京市房屋的價格缓淹,價格作為標(biāo)注就是一個連續(xù)值,屬于回歸問題塔逃。
  • 無監(jiān)督學(xué)習(xí):訓(xùn)練樣本沒有標(biāo)注讯壶,無監(jiān)督學(xué)習(xí)解決的典型問題是聚類(clustering)問題。比如對一個網(wǎng)站的用戶進行聚類湾盗,看看這個網(wǎng)站用戶的大致構(gòu)成伏蚊,分析下每類用戶群的特點是什么。

此外淹仑,機器學(xué)習(xí)還有其他的類別丙挽,比如半監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)匀借、深度學(xué)習(xí)颜阐、增強學(xué)習(xí)

  • 半監(jiān)督學(xué)習(xí):這類問題給出的訓(xùn)練數(shù)據(jù),有一部分有標(biāo)簽吓肋,有一部分沒有標(biāo)簽凳怨。我們想學(xué)習(xí)出數(shù)據(jù)組織結(jié)構(gòu)的同時,也能做相應(yīng)的預(yù)測是鬼。此類問題相對應(yīng)的機器學(xué)習(xí)算法有自訓(xùn)練(Self-Training)肤舞、直推學(xué)習(xí)(Transductive Learning)、生成式模型(Generative Model)等均蜜。

機器學(xué)習(xí)常見算法如下圖所示(詳細分類見博客:http://blog.csdn.net/han_xiaoyang/article/details/50469334):

算法.png

機器學(xué)習(xí)算法選擇流程如下圖:


算法樹.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末李剖,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子囤耳,更是在濱河造成了極大的恐慌篙顺,老刑警劉巖偶芍,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異德玫,居然都是意外死亡匪蟀,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門宰僧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來材彪,“玉大人,你說我怎么就攤上這事琴儿《位” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵凤类,是天一觀的道長穗泵。 經(jīng)常有香客問我普气,道長谜疤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任现诀,我火速辦了婚禮夷磕,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘仔沿。我一直安慰自己坐桩,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布封锉。 她就那樣靜靜地躺著绵跷,像睡著了一般。 火紅的嫁衣襯著肌膚如雪成福。 梳的紋絲不亂的頭發(fā)上碾局,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天,我揣著相機與錄音奴艾,去河邊找鬼净当。 笑死,一個胖子當(dāng)著我的面吹牛蕴潦,可吹牛的內(nèi)容都是我干的像啼。 我是一名探鬼主播,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼潭苞,長吁一口氣:“原來是場噩夢啊……” “哼忽冻!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起此疹,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤僧诚,失蹤者是張志新(化名)和其女友劉穎蜜猾,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體振诬,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡蹭睡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了赶么。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片肩豁。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖辫呻,靈堂內(nèi)的尸體忽然破棺而出清钥,到底是詐尸還是另有隱情,我是刑警寧澤放闺,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布祟昭,位于F島的核電站,受9級特大地震影響怖侦,放射性物質(zhì)發(fā)生泄漏篡悟。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一匾寝、第九天 我趴在偏房一處隱蔽的房頂上張望搬葬。 院中可真熱鬧,春花似錦艳悔、人聲如沸急凰。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽抡锈。三九已至,卻和暖如春乔外,著一層夾襖步出監(jiān)牢的瞬間床三,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工袁稽, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留勿璃,地道東北人。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓推汽,卻偏偏與公主長得像补疑,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子歹撒,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容