機(jī)器學(xué)習(xí)入門——理論篇

一迂尝、機(jī)器學(xué)習(xí)初步認(rèn)識

1嘉熊、什么是機(jī)器學(xué)習(xí)陈惰?

機(jī)器學(xué)習(xí)就是利用計(jì)算機(jī)從歷史數(shù)據(jù)中找出規(guī)律,并把這些規(guī)律用到對未來不確定場景的決策

比如預(yù)測某公司未來一個(gè)季度的銷量禀挫,這就需要根據(jù)以往季度的銷量情況進(jìn)行分析找出規(guī)律旬陡,然后對下一個(gè)季度的銷量進(jìn)行預(yù)測。

機(jī)器學(xué)習(xí)的主體是機(jī)器语婴,而不是人描孟,與之對應(yīng)的一個(gè)事——也是從歷史數(shù)據(jù)中尋找規(guī)律,是數(shù)據(jù)分析砰左,這個(gè)主體是人匿醒。

從數(shù)據(jù)中尋找規(guī)律,其實(shí)就是機(jī)器學(xué)習(xí)一系列的算法缠导,不同的算法找出來的規(guī)律的形式是不一樣的廉羔,大部分情況下,就是找出一個(gè)數(shù)學(xué)函數(shù)或者是數(shù)學(xué)公式僻造。

2憋他、從數(shù)據(jù)中尋找規(guī)律

統(tǒng)計(jì)學(xué)從數(shù)據(jù)中找規(guī)律的過程:由于受限于計(jì)算能力的限制,主要靠手算或者低端計(jì)算機(jī)髓削,一般采用抽樣計(jì)算竹挡,然后描述統(tǒng)計(jì),最后根據(jù)結(jié)論回去作假設(shè)檢驗(yàn)立膛,統(tǒng)計(jì)推斷此迅。

由于計(jì)算機(jī)性能的極大提升,現(xiàn)在不用再作抽樣統(tǒng)計(jì)旧巾,可以作全量分析

3忍些、機(jī)器學(xué)習(xí)為什么突然火起來
  • 從歷史數(shù)據(jù)中找出規(guī)律鲁猩,把這些規(guī)律用到對未來自動作出決定
  • 用數(shù)據(jù)代替專家
  • 經(jīng)濟(jì)驅(qū)動,數(shù)據(jù)變現(xiàn)罢坝,也就是大數(shù)據(jù)的迅猛發(fā)展
4廓握、業(yè)務(wù)系統(tǒng)發(fā)展的歷史
  • 早期:基于專家經(jīng)驗(yàn)
  • 基于統(tǒng)計(jì)——分維度統(tǒng)計(jì)
  • 機(jī)器學(xué)習(xí)——在線學(xué)習(xí)(比如電商網(wǎng)站的針對用戶實(shí)時(shí)的推薦)

二搅窿、機(jī)器學(xué)習(xí)的應(yīng)用

1、關(guān)聯(lián)規(guī)則
  • 購物車分析——關(guān)聯(lián)規(guī)則
    其實(shí)這是一個(gè)典型的數(shù)據(jù)挖掘算法隙券,生活中常見的如啤酒和紙尿布的案例
2男应、聚類
  • 用戶細(xì)分和精準(zhǔn)營銷
    如用相關(guān)聚類算法,對移動消費(fèi)者用戶消費(fèi)習(xí)慣進(jìn)行分類娱仔,然后有針對性的作出一些資費(fèi)套餐沐飘,如全球通,神州行牲迫,動感地帶等
3耐朴、樸素貝葉斯和決策樹
  • 樸素貝葉斯:垃圾郵件
  • 決策樹:信用卡欺詐
4、ctr預(yù)估
  • 互聯(lián)網(wǎng)廣告:預(yù)測用戶最有可能點(diǎn)擊的頁面盹憎,來進(jìn)行排列頁面推薦順序
  • 推薦系統(tǒng):電商網(wǎng)站中常用推薦商品
5筛峭、自然語言處理和圖形識別
  • 自然語言處理(NLP)
    情感分析,實(shí)體識別等
  • 圖像識別
    深度學(xué)習(xí)

更多應(yīng)用:

  • 語音識別
  • 個(gè)性化醫(yī)療
  • 人臉識別
  • 自動駕駛
  • 智慧機(jī)器人
  • 私人虛擬助理
  • 手勢控制
  • 視頻內(nèi)容自動識別
  • 機(jī)器實(shí)時(shí)翻譯

三陪每、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)

1影晓、區(qū)別
  • 交易數(shù)據(jù) VS 行為數(shù)據(jù)

一般數(shù)據(jù)分析處理的是交易數(shù)據(jù),比如電商平臺數(shù)據(jù)檩禾,銀行存款數(shù)據(jù)等

而機(jī)器學(xué)習(xí)處理的是行為數(shù)據(jù)挂签,比如用戶的搜索歷史,瀏覽歷史锌订,評論等

  • 少量數(shù)據(jù) VS 海量數(shù)據(jù)

  • 采樣分析 VS 海量分析

  • 報(bào)告過去的事 VS 預(yù)測未來的事

  • 技術(shù)手段不同

數(shù)據(jù)分析的數(shù)據(jù)集量相對于機(jī)器學(xué)習(xí)要小

分析方法上竹握,數(shù)據(jù)分析主要是用戶驅(qū)動,交互式分析辆飘,機(jī)器學(xué)習(xí)是數(shù)據(jù)驅(qū)動啦辐,自動進(jìn)行知識發(fā)展

四、機(jī)器學(xué)習(xí)常用算法

1蜈项、算法分類(1)
  • 有監(jiān)督學(xué)習(xí)

包括分類算法(垃圾郵件區(qū)分)芹关、回歸算法

  • 無監(jiān)督學(xué)習(xí)

包括聚類算法

  • 半監(jiān)督學(xué)習(xí)

強(qiáng)化學(xué)習(xí)

2、算法分類(2)

根據(jù)具體的問題分類

  • 分類與回歸
  • 聚類
  • 標(biāo)注
3紧卒、算法分類(3)
  • 生成模型
  • 判別模型

五侥衬、機(jī)器學(xué)習(xí)如何解決問題

1、確定目標(biāo)
  • 業(yè)務(wù)需求
  • 解決數(shù)據(jù)問題
  • 提取特征工程
2跑芳、訓(xùn)練模型
  • 定義模型
  • 定義損失函數(shù)(重點(diǎn))
  • 優(yōu)化算法(重點(diǎn))
3轴总、模型評估
  • 交叉驗(yàn)證
  • 效果評估
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市博个,隨后出現(xiàn)的幾起案子怀樟,更是在濱河造成了極大的恐慌,老刑警劉巖盆佣,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件往堡,死亡現(xiàn)場離奇詭異械荷,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)虑灰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進(jìn)店門吨瞎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人穆咐,你說我怎么就攤上這事颤诀。” “怎么了庸娱?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵着绊,是天一觀的道長。 經(jīng)常有香客問我熟尉,道長归露,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任斤儿,我火速辦了婚禮剧包,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘往果。我一直安慰自己疆液,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布陕贮。 她就那樣靜靜地躺著堕油,像睡著了一般。 火紅的嫁衣襯著肌膚如雪肮之。 梳的紋絲不亂的頭發(fā)上掉缺,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天,我揣著相機(jī)與錄音戈擒,去河邊找鬼眶明。 笑死,一個(gè)胖子當(dāng)著我的面吹牛筐高,可吹牛的內(nèi)容都是我干的搜囱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼柑土,長吁一口氣:“原來是場噩夢啊……” “哼蜀肘!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起稽屏,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤幌缝,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后诫欠,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體涵卵,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年荒叼,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了轿偎。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,102評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡被廓,死狀恐怖坏晦,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情嫁乘,我是刑警寧澤昆婿,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站蜓斧,受9級特大地震影響仓蛆,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜挎春,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一看疙、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧直奋,春花似錦能庆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至邮绿,卻和暖如春渠旁,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背斯碌。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工一死, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人傻唾。 一個(gè)月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓投慈,卻偏偏與公主長得像,于是被迫代替她去往敵國和親冠骄。 傳聞我的和親對象是個(gè)殘疾皇子伪煤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容