統(tǒng)計學(xué)習(xí)方法入門

統(tǒng)計學(xué)習(xí)

“學(xué)習(xí)”的定義:“如果一個系統(tǒng)能通過執(zhí)行某個過程改進(jìn)它的性能眉撵,這就是學(xué)習(xí)”帐要。
現(xiàn)如今的機(jī)器學(xué)習(xí)一般就是統(tǒng)計機(jī)器學(xué)習(xí)把敞。
統(tǒng)計學(xué)習(xí)的對象:data

  1. 提取特征
  2. 抽象模型
  3. 進(jìn)行分析和預(yù)測

統(tǒng)計學(xué)習(xí)的目標(biāo):

  1. 學(xué)習(xí)什么樣的模型
  2. 如何學(xué)習(xí)模型

統(tǒng)計學(xué)習(xí)方法類型:

  1. supervised learning
  2. unsupervised learning
  3. semi-supervised learning
  4. reforcement learning
  5. more...

統(tǒng)計學(xué)習(xí)的步驟

  1. 得到一個有限的訓(xùn)練數(shù)據(jù)集合, training data
  2. 確定所有學(xué)習(xí)模型的集合,model
  3. 確定模型選擇的準(zhǔn)則榨惠,strategy
  4. 實現(xiàn)求解最優(yōu)模型的算法奋早,algorithm
  5. 通過學(xué)習(xí)方法選擇最優(yōu)方法
  6. 利用最優(yōu)模型對新數(shù)據(jù)進(jìn)行預(yù)測分析

監(jiān)督學(xué)習(xí)

過程: 輸入 ----------> 特征向量 ------>特征空間 ----->輸出空間

輸入變量X盛霎,輸出變量Y:

  • 回歸問題:輸入輸出均為連續(xù)變量的預(yù)測問題
  • 分類問題:輸入輸出均為有限個離散變量的預(yù)測問題
  • 標(biāo)注問題:輸入輸出均為變量序列的預(yù)測問題

統(tǒng)計學(xué)習(xí)三要素

  • 模型
    統(tǒng)計學(xué)習(xí)首要考慮的問題。
    在監(jiān)督學(xué)習(xí)中耽装,模型就是所要學(xué)習(xí)的條件概率分布或決策函數(shù)摩渺。

  • 策略

    • 損失函數(shù)
      • 定義:用來度量輸出的預(yù)測值f(X)與真實值Y之間不一致(錯誤)的程度。
      • 常見損失函數(shù):0-1損失函數(shù)剂邮,平方損失函數(shù)
        記作L(f(X),Y)
      • 意義:損失函數(shù)數(shù)值越小,模型就越好横侦。
      • 期望風(fēng)險:Rexp(f)
    • 風(fēng)險函數(shù)
      • 經(jīng)驗風(fēng)險
        定義:模型關(guān)于訓(xùn)練數(shù)據(jù)集的平均損失挥萌。
        Remp(f) : sum(L(yi,f(xi)))/N,當(dāng)N趨于無限大式,經(jīng)驗風(fēng)險趨于期望風(fēng)險枉侧。
        經(jīng)驗風(fēng)險最小化容易導(dǎo)致過擬合現(xiàn)象
      • 結(jié)構(gòu)風(fēng)險
        意義:防止過擬合
        定義: 在經(jīng)驗風(fēng)險的基礎(chǔ)上加上表示模型復(fù)雜度的正則化項或罰項
        Rsrm(f) : sum(L(yi,f(xi)))/N + lambda(J(f))
  • 算法
    經(jīng)過策略引瀑,問題歸結(jié)為最優(yōu)化問題,統(tǒng)計學(xué)習(xí)的算法成為求解最優(yōu)化問題的算法榨馁。
    挑戰(zhàn):如果保證找到全局最優(yōu)解憨栽,并使求解的過程非常高效。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末翼虫,一起剝皮案震驚了整個濱河市屑柔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌珍剑,老刑警劉巖掸宛,帶你破解...
    沈念sama閱讀 218,386評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異招拙,居然都是意外死亡唧瘾,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評論 3 394
  • 文/潘曉璐 我一進(jìn)店門别凤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來饰序,“玉大人,你說我怎么就攤上這事规哪∏笤ィ” “怎么了?”我有些...
    開封第一講書人閱讀 164,704評論 0 353
  • 文/不壞的土叔 我叫張陵由缆,是天一觀的道長注祖。 經(jīng)常有香客問我,道長均唉,這世上最難降的妖魔是什么是晨? 我笑而不...
    開封第一講書人閱讀 58,702評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮舔箭,結(jié)果婚禮上罩缴,老公的妹妹穿的比我還像新娘蚊逢。我一直安慰自己,他們只是感情好箫章,可當(dāng)我...
    茶點故事閱讀 67,716評論 6 392
  • 文/花漫 我一把揭開白布烙荷。 她就那樣靜靜地躺著,像睡著了一般檬寂。 火紅的嫁衣襯著肌膚如雪终抽。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,573評論 1 305
  • 那天桶至,我揣著相機(jī)與錄音昼伴,去河邊找鬼。 笑死镣屹,一個胖子當(dāng)著我的面吹牛圃郊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播女蜈,決...
    沈念sama閱讀 40,314評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼持舆,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了伪窖?” 一聲冷哼從身側(cè)響起逸寓,我...
    開封第一講書人閱讀 39,230評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎覆山,沒想到半個月后席覆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,680評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡汹买,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,873評論 3 336
  • 正文 我和宋清朗相戀三年佩伤,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片晦毙。...
    茶點故事閱讀 39,991評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡生巡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出见妒,到底是詐尸還是另有隱情孤荣,我是刑警寧澤,帶...
    沈念sama閱讀 35,706評論 5 346
  • 正文 年R本政府宣布须揣,位于F島的核電站盐股,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏耻卡。R本人自食惡果不足惜疯汁,卻給世界環(huán)境...
    茶點故事閱讀 41,329評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望卵酪。 院中可真熱鬧幌蚊,春花似錦谤碳、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至漩仙,卻和暖如春搓茬,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背队他。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評論 1 270
  • 我被黑心中介騙來泰國打工垮兑, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人漱挎。 一個月前我還...
    沈念sama閱讀 48,158評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像雀哨,于是被迫代替她去往敵國和親磕谅。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,941評論 2 355

推薦閱讀更多精彩內(nèi)容