機器學習-1 概論

返回主頁


機器學習(或統(tǒng)計學習)算法的目標是減少預期的泛化誤差种吸,這也被稱為損失(Loss)肴掷。如果我們知道真實的分布 P(X,Y)照藻,那么使損失最小化就是一個可以通過優(yōu)化算法來解決的最優(yōu)化任務痊焊。

但是囊陡,我們并不知道真實分布的形態(tài)纽乱,只是有一堆可用于訓練的樣本而已蛾绎。因此,我們需要基于給定的樣本攢出一個優(yōu)化問題鸦列,即最小化在訓練集上的誤差租冠,并由訓練集所定義的經(jīng)驗分布近似真實的期望分布。

1.1 統(tǒng)計學習

  1. 統(tǒng)計學習的特點
    統(tǒng)計學習(statistical learning):是關(guān)于計算機基于數(shù)據(jù)構(gòu)建概率統(tǒng)計模型并運用模型對數(shù)據(jù)進行分析預測的一門學科薯嗤。是計算機系統(tǒng)通過運用統(tǒng)計方法從數(shù)據(jù)中提煉潛在的模式與關(guān)系顽爹,從而提高系統(tǒng)性能的機器學習。
    (1)骆姐、以計算機及網(wǎng)絡為平臺
    (2)镜粤、以數(shù)據(jù)為研究對象(數(shù)據(jù)驅(qū)動)
    (3)、以分析和預測為研究目的
    (4)玻褪、以概率論肉渴、統(tǒng)計學、信息論带射、優(yōu)化理論同规、計算機科學為基礎(chǔ)學科
  2. 統(tǒng)計學習的對象
    數(shù)據(jù)(data):數(shù)字、文字窟社、圖象券勺、視頻、音頻及其組合灿里。
  3. 統(tǒng)計學習的目的
    (1)关炼、分析:獲取新知識,帶來新發(fā)現(xiàn)
    (2)钠四、預測:提升系統(tǒng)性能
  4. 統(tǒng)計學習的步驟
    (1)盗扒、獲取訓練集(有限的)
    (2)跪楞、確定假設空間(模型的集合缀去,假設函數(shù))
    (3)、確定學習策略(風險函數(shù))
    (4)甸祭、確定優(yōu)化算法
    (5)缕碎、學習得到最優(yōu)模型
    (6)、模型分析與預測

1.2 統(tǒng)計學習的分類
1.2.1 基本分類
(1)池户、監(jiān)督學習(supervised learning):從標注數(shù)據(jù)中學習預測模型的機器學習問題咏雌。

特征空間

注:模型實際上都是定義在特征空間上的凡怎。

輸入輸出對又稱為樣本(sample)

注:監(jiān)督學習的基本假設要求隨機變量X和Y服從聯(lián)合概率分布P(X,Y),它可以是PMF也可以是PDF赊抖,但只是假設其存在统倒,對學習系統(tǒng)來說,聯(lián)合概率分布的具體定義是未知的氛雪,因為如果知道了P(X,Y)房匆,就可以求出條件概率分布P(Y|X),也就不需要學習了报亩。

監(jiān)督學習

(2)浴鸿、無監(jiān)督學習(unsupervised learning):從無標注數(shù)據(jù)中學習預測模型的機器學習問題,其本質(zhì)是學習數(shù)據(jù)中的統(tǒng)計規(guī)律潛在結(jié)構(gòu)弦追,例如聚類岳链、降維、概率估計劲件。

無監(jiān)督學習

(3)掸哑、強化學習(reinforcement learning):智能系統(tǒng)在與環(huán)境的連續(xù)互動中學習最優(yōu)行為策略的機器學習問題。

1.2.2 按模型分類
(1)寇仓、概率模型(probabilistic model):也叫生成模型举户,即模型表示了從 x 產(chǎn)生 y 的生成關(guān)系。

條件概率分布

(2)遍烦、非概率模型(nonprobabilistic model):也叫判別模型俭嘁,判別模型關(guān)心的是 x 應該預測什么樣的 y。

注:
概率模型一定可以表示為聯(lián)合概率分布的形式服猪,而非概率模型則不能供填;
概率模型收斂速度更快;
概率模型可以存在隱變量罢猪,而非概率模型則不能近她。
判別模型直接面對預測,準確率更高膳帕;
判別模型可以定義高度抽象的特征工程粘捎,因此可以簡化學習問題。

1.3 統(tǒng)計學習方法三要素
1.3.1 假設空間(假設函數(shù)的集合)

F是假設空間危彩,theta是參數(shù)向量攒磨,R是n維參數(shù)空間

注:假設空間中的模型一般有無窮多個。

1.3.2 風險函數(shù)(損失函數(shù))
期望風險(expected risk)

經(jīng)驗風險(empirical risk)

結(jié)構(gòu)風險(structural risk)= 經(jīng)驗風險 + 正則化項

1.3.3 優(yōu)化算法
求解目標函數(shù)

目標函數(shù)的一般形式

注:統(tǒng)計學習方法具體采用的損失函數(shù)未必是模型評估時使用的評估函數(shù)

補:J(f)是正則化項汤徽,它是模型復雜度的單調(diào)遞增函數(shù)娩缰,模型越復雜,正則化值就越大谒府,正則化項一般定義為模型參數(shù)向量的范數(shù)(L1,L2)拼坎。在凸優(yōu)化中浮毯,目標函數(shù)經(jīng)正則化得到的最優(yōu)值是原問題最優(yōu)值的下界,證明如下:

正則化符合奧卡姆剃刀(Occam's razor)原理:在所有可能選擇的模型中泰鸡,能夠很好地解釋已知數(shù)據(jù)并且十分簡單才是最好的模型债蓝。

1.6 泛化能力
泛化能力(generalization ability):學習方法對未知數(shù)據(jù)的預測能力。

1.6.2 泛化誤差及其上界

注:泛化誤差就是期望風險

泛化誤差上界盛龄,第一項是泛化誤差惦蚊,第二項是經(jīng)驗誤差,第三項是N的單調(diào)遞減函數(shù)

證明

返回主頁

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末讯嫂,一起剝皮案震驚了整個濱河市蹦锋,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌欧芽,老刑警劉巖莉掂,帶你破解...
    沈念sama閱讀 212,029評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異千扔,居然都是意外死亡憎妙,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,395評論 3 385
  • 文/潘曉璐 我一進店門曲楚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來厘唾,“玉大人,你說我怎么就攤上這事龙誊「Ю” “怎么了?”我有些...
    開封第一講書人閱讀 157,570評論 0 348
  • 文/不壞的土叔 我叫張陵趟大,是天一觀的道長鹤树。 經(jīng)常有香客問我,道長逊朽,這世上最難降的妖魔是什么罕伯? 我笑而不...
    開封第一講書人閱讀 56,535評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮叽讳,結(jié)果婚禮上追他,老公的妹妹穿的比我還像新娘。我一直安慰自己岛蚤,他們只是感情好邑狸,可當我...
    茶點故事閱讀 65,650評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著灭美,像睡著了一般推溃。 火紅的嫁衣襯著肌膚如雪昂利。 梳的紋絲不亂的頭發(fā)上届腐,一...
    開封第一講書人閱讀 49,850評論 1 290
  • 那天铁坎,我揣著相機與錄音,去河邊找鬼犁苏。 笑死硬萍,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的围详。 我是一名探鬼主播朴乖,決...
    沈念sama閱讀 39,006評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼助赞!你這毒婦竟也來了买羞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,747評論 0 268
  • 序言:老撾萬榮一對情侶失蹤雹食,失蹤者是張志新(化名)和其女友劉穎畜普,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體群叶,經(jīng)...
    沈念sama閱讀 44,207評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡吃挑,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,536評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了街立。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片舶衬。...
    茶點故事閱讀 38,683評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖赎离,靈堂內(nèi)的尸體忽然破棺而出逛犹,到底是詐尸還是另有隱情,我是刑警寧澤梁剔,帶...
    沈念sama閱讀 34,342評論 4 330
  • 正文 年R本政府宣布圾浅,位于F島的核電站,受9級特大地震影響憾朴,放射性物質(zhì)發(fā)生泄漏狸捕。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,964評論 3 315
  • 文/蒙蒙 一众雷、第九天 我趴在偏房一處隱蔽的房頂上張望灸拍。 院中可真熱鬧,春花似錦砾省、人聲如沸鸡岗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,772評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽轩性。三九已至,卻和暖如春狠鸳,著一層夾襖步出監(jiān)牢的瞬間揣苏,已是汗流浹背悯嗓。 一陣腳步聲響...
    開封第一講書人閱讀 32,004評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留卸察,地道東北人脯厨。 一個月前我還...
    沈念sama閱讀 46,401評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像坑质,于是被迫代替她去往敵國和親合武。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,566評論 2 349

推薦閱讀更多精彩內(nèi)容