- 本文首發(fā)自公眾號:RAIS
前言
本系列文章為 《Deep Learning》 讀書筆記融痛,可以參看原書一起閱讀,效果更佳神僵。深度學習是機器學習的子集雁刷,因此想更深入的了解深度學習,需要對機器學習的一些基本原理保礼。
學習算法
機器學習算法是一種能夠從數據中學習的算法沛励,有人給出學習的定義 “對于某類任務 T 和性能度量 P责语,一個計算機程序被認為可以從經驗 E 中學習是指,通過經驗 E 改進后目派,它在任務 T 上由性能度量 P 衡量的性能有所提升”(通過經驗以提高計算機程序在某些任務上性能的算法)鹦筹,我們分別聊一聊其中提到的 任務 T,性能度量 P 和 經驗 E址貌,最后再給出一個例子進行說明铐拐。
任務 T
我們之前的文章中提到過幾種機器學習類別,比如二分類問題练对,多分類問題遍蟋,回歸問題等,接下來我們做一個總結螟凭。
- 分類:計算機程序需要指定某些輸入屬于 K 類中的哪一類虚青。對于此類問題,機器學習算法可能會返回一個函數:
螺男,或者是不同類別的概率分布棒厘。
- 輸入缺失分類:輸入的數據有可能“不好”,有一些屬性的缺失等下隧,這樣算法學習出來的映射關系就可能不是單一的了奢人,有可能是一組函數,其中分別對應著不同屬性的缺失(數學做法上可能不是單純的計算某些屬性缺失后進行訓練淆院,而有可能是計算其聯(lián)合概率分布)何乎。
- 回歸問題:對給定輸入預測數值,例如以前個房屋價格預測問題土辩。
- 轉錄問題:機器學習系統(tǒng)觀測一些非結構化表示的數據支救,轉錄為離散的文本形式。例如根據圖片內容返回文本內容或者是語音識別拷淘。
- 機器翻譯:輸入一種語言各墨,翻譯成另外一種語言,自然語言處理問題启涯。
- 結構化輸出:這是針對輸出而言的贬堵,輸出是向量或者是其他包含多個值的數據結構。例子有語法分析逝嚎、圖像的像素級分割扁瓢。
- 異常檢測:標記不正常或非典型的個體补君,例如信用卡盜刷或者是異地登錄檢測等引几。
- 合成和采樣:機器學習生成一些和訓練數據相似的新樣本,比如模仿某些作家作詩、音樂家譜曲等伟桅。
- 缺失值填補:機器學習對樣本中的缺失值進行填補敞掘。
- 去噪:機器學習算法通過損壞的樣本預測干凈的樣本,或者是預測條件概率分布楣铁。
性能度量 P
對于不同的問題我們的度量指標不同玖雁,最常用的 準確率、錯誤率 針對分類盖腕、缺失輸入和轉錄任務等任務赫冬。一般情況下所需要解決的實際問題就是性能度量指標。一般情況下溃列,我們會將數據分為 訓練集 和 測試集劲厌,我們會用普通的辦法根據概率或經驗預測,給出一個基準值听隐,學習后的模型優(yōu)于這個基準值才算是有效的补鼻。
經驗 E
機器學習算法根據經驗不同,可以分為 無監(jiān)督學習算法 和 監(jiān)督學習算法雅任。無監(jiān)督學習算法是在含有許多特征的數據集中學習出有用的特征或結構性質风范,在無指導的情況下理解數據;監(jiān)督學習算法數據集中的樣本包含標簽或目標沪么,有目標導向硼婿。注意機器學習中監(jiān)督和非監(jiān)督形式的這兩種方法很多情況下是一起使用的。這兩種方法都是固定數據集的成玫,需要指出 強化學習 算法會和環(huán)境交互加酵,數據集不是固定的拳喻。數據集的表示方法是 矩陣哭当,每一行是一條數據,每一列是一個數據項冗澈。
線性回歸
這是一個例子钦勘,這是一個回歸問題,因此是一個預測問題亚亲,線性代表數據具有線性關系彻采,如常說的正比關系,特點是模型簡單捌归,容易解釋肛响,且速度快,在機器學習中有很大的用處惜索。
- 本文首發(fā)自公眾號:RAIS