什么是機器學(xué)習(xí)
- 對于某給定的 任務(wù)T,在合理的性能度量方案P的前提下,計算機程序可以自主學(xué)習(xí) 任務(wù)T的 經(jīng)驗E隨著提供大量的锅棕,合適的,優(yōu)質(zhì)的經(jīng)驗E淌山,該程序?qū)τ?strong>任務(wù)T的 性能逐步提高裸燎。
- 機器學(xué)習(xí)的對象
任務(wù)Task,T,一個或多個
經(jīng)驗Experience,E
性能Performance,P
人類的學(xué)習(xí)
- 有監(jiān)督學(xué)習(xí)
月亮的認(rèn)知(夜空中最明亮的天體),知道是(1)還是不是(0)月亮 - 無監(jiān)督學(xué)習(xí)
閱兵泼疑,沒有0或1的認(rèn)知 - 增強學(xué)習(xí)
走路(多次嘗試德绿,有正激勵),踢球
機器學(xué)習(xí)的內(nèi)涵和外延
- ML可以解決什么
給定數(shù)據(jù)的預(yù)測問題
-- 數(shù)據(jù)清洗/特征選擇
-- 確定算法模型/參數(shù)優(yōu)化
-- 結(jié)果預(yù)測 - 不能解決什么
大數(shù)據(jù)存儲/并行計算
做一個機器人
ML的一般流程
- 數(shù)據(jù)收集(x[training text],y[labels])
- 數(shù)據(jù)清洗(爬蟲)
- 特征工程
- 數(shù)據(jù)建模(調(diào)參退渗,調(diào)包)
機器學(xué)習(xí)基礎(chǔ)知識
- 向量空間模型
- 高維數(shù)據(jù)降維
- 相似度計算方法(歐氏距離移稳、杰卡德相似系數(shù)、余弦相似系數(shù)会油、Pearson相似系數(shù)个粱、相對熵K-L系數(shù)、Hellinger距離)
- 基礎(chǔ)概率統(tǒng)計知識(最大似然估計)
- Taylor展示等在機器學(xué)習(xí)中的應(yīng)用(數(shù)值近似計算翻翩、考察Gini系數(shù)的 圖像都许、熵、分類誤差率)
- 矩陣乘法與馬爾科夫模型
- 特征值與特征向量
- rand7到rand10