簡介
人工智能
人工制造出來的系統(tǒng)所表現(xiàn)出來的智能。人工智能的核心問題包括推理、知識、交流狡蝶、感知琳钉、移動和操作物體的能力倾贰。
機(jī)器學(xué)習(xí)
通過算法郁妈,是機(jī)器能從大量歷史數(shù)據(jù)中學(xué)習(xí)到規(guī)律,從而對新的樣本做出智能識別或?qū)ξ磥碜鲱A(yù)測甲锡。
深度學(xué)習(xí)
機(jī)器學(xué)習(xí)的新領(lǐng)域。深度——是因為機(jī)器學(xué)習(xí)只是千層的學(xué)習(xí)羽戒,主要是基于概率搔体、矩陣等知識而得出的結(jié)論。而深度學(xué)習(xí)所涉及的概念比較復(fù)雜半醉,包括人工神經(jīng)網(wǎng)絡(luò)的研究等疚俱。
機(jī)器學(xué)習(xí)概述
機(jī)器學(xué)習(xí)概述
背景
圖靈
發(fā)展現(xiàn)狀
數(shù)據(jù)現(xiàn)狀
Facebook
瓶頸:
- 數(shù)據(jù)產(chǎn)生和數(shù)據(jù)收集的瓶頸
- 采集到的數(shù)據(jù)和能被分析的數(shù)據(jù)之間的瓶頸
算法現(xiàn)狀
模型的訓(xùn)練與識別、語義分析缩多、文本情感分析呆奕、圖像識別技術(shù)。
機(jī)器學(xué)習(xí)的基本概念
機(jī)器學(xué)習(xí)的流程
- 場景解析(想清楚業(yè)務(wù)邏輯)
- 數(shù)據(jù)預(yù)處理(數(shù)據(jù)的清晰工作衬吆,歸一化梁钾、標(biāo)準(zhǔn)化)
- 特征工程
- 模型訓(xùn)練
- 模型評估
- 離線/在線服務(wù)
數(shù)據(jù)源結(jié)構(gòu)
- 結(jié)構(gòu)化數(shù)據(jù)(純數(shù)字)
- 半結(jié)構(gòu)化數(shù)據(jù)(帶有字符串)
- 非機(jī)構(gòu)化數(shù)據(jù)
算法分類
- 監(jiān)督學(xué)習(xí)(進(jìn)入算法的訓(xùn)練數(shù)據(jù)樣本都有賭贏的期望值也就是目標(biāo)值,進(jìn)行及其學(xué)習(xí)的過程實際上就是特征值和目標(biāo)值的映射過程——心臟病逊抡,海關(guān)問題姆泻。K近鄰、樸素貝葉斯冒嫡、決策樹拇勃、隨即森林、GBDT和支持向量機(jī)孝凌,回歸算法:邏輯回歸方咆、線性回歸。解釋一下回歸和分類的區(qū)別)
分類問題是指蟀架,給定一個新的模式瓣赂,根據(jù)訓(xùn)練集推斷它所對應(yīng)的類別(如:+1,-1)片拍,是一種定性輸出煌集,也叫離散變量預(yù)測; 回歸問題是指捌省,給定一個新的模式苫纤,根據(jù)訓(xùn)練集推斷它所對應(yīng)的輸出值(實數(shù))是多少,是一種定量輸出,也叫連續(xù)變量預(yù)測方面。
- 無監(jiān)督學(xué)習(xí)(訓(xùn)練樣本不依賴達(dá)標(biāo)數(shù)據(jù)的機(jī)器學(xué)習(xí)——聚類場景問題放钦,因為確實目標(biāo)列,能做的事情就只剩下對比不同樣本間的距離關(guān)系恭金。K-Means操禀、DBScan)
- 半監(jiān)督學(xué)習(xí)(最近幾年比較流行,獲得達(dá)標(biāo)數(shù)據(jù)是非常耗費資源的横腿,但是無監(jiān)督學(xué)習(xí)對于解決分類和回歸這樣的場景問題又有一些難度颓屑,部分達(dá)標(biāo)、部分給算法學(xué)習(xí)耿焊。標(biāo)簽傳播算法)