機(jī)器學(xué)習(xí)正在進(jìn)步,我們似乎正在不斷接近我們心中的人工智能目標(biāo)魁索。語(yǔ)音識(shí)別融撞、圖像檢測(cè)、機(jī)器翻譯蛾默、風(fēng)格遷移等技術(shù)已經(jīng)在我們的實(shí)際生活中開(kāi)始得到了應(yīng)用懦铺,但機(jī)器學(xué)習(xí)的發(fā)展仍還在繼續(xù),甚至被認(rèn)為有可能徹底改變?nèi)祟愇拿鞯陌l(fā)展方向乃至人類自身支鸡。但你了解現(xiàn)在正在發(fā)生的這場(chǎng)變革嗎冬念?四大會(huì)計(jì)師事務(wù)所之一的普華永道(PwC)近日發(fā)布了多份解讀機(jī)器學(xué)習(xí)基礎(chǔ)的圖表,其中介紹了機(jī)器學(xué)習(xí)的基本概念牧挣、原理急前、歷史、未來(lái)趨勢(shì)和一些常見(jiàn)的算法瀑构。為便于讀者閱讀裆针,機(jī)器之心對(duì)這些圖表進(jìn)行了編譯和拆分刨摩,分三大部分對(duì)這些內(nèi)容進(jìn)行了呈現(xiàn),其中也加入了一些擴(kuò)展鏈接世吨,希望能幫助你進(jìn)一步擴(kuò)展閱讀澡刹。
一、機(jī)器學(xué)習(xí)概覽
1. 什么是機(jī)器學(xué)習(xí)耘婚?
機(jī)器通過(guò)分析大量數(shù)據(jù)來(lái)進(jìn)行學(xué)習(xí)罢浇。比如說(shuō),不需要通過(guò)編程來(lái)識(shí)別貓或人臉沐祷,它們可以通過(guò)使用圖片來(lái)進(jìn)行訓(xùn)練嚷闭,從而歸納和識(shí)別特定的目標(biāo)。
2. 機(jī)器學(xué)習(xí)和人工智能的關(guān)系
機(jī)器學(xué)習(xí)是一種重在尋找數(shù)據(jù)中的模式并使用這些模式來(lái)做出預(yù)測(cè)的研究和算法的門類赖临。機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的一部分胞锰,并且和知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘有所交集。更多解讀可參閱《一文讀懂機(jī)器學(xué)習(xí)兢榨、數(shù)據(jù)科學(xué)嗅榕、人工智能、深度學(xué)習(xí)和統(tǒng)計(jì)學(xué)之間的區(qū)別》色乾。
3. 機(jī)器學(xué)習(xí)的工作方式
①選擇數(shù)據(jù):將你的數(shù)據(jù)分成三組:訓(xùn)練數(shù)據(jù)誊册、驗(yàn)證數(shù)據(jù)和測(cè)試數(shù)據(jù)
②模型數(shù)據(jù):使用訓(xùn)練數(shù)據(jù)來(lái)構(gòu)建使用相關(guān)特征的模型
③驗(yàn)證模型:使用你的驗(yàn)證數(shù)據(jù)接入你的模型
④測(cè)試模型:使用你的測(cè)試數(shù)據(jù)檢查被驗(yàn)證的模型的表現(xiàn)
⑤使用模型:使用完全訓(xùn)練好的模型在新數(shù)據(jù)上做預(yù)測(cè)
⑥調(diào)優(yōu)模型:使用更多數(shù)據(jù)、不同的特征或調(diào)整過(guò)的參數(shù)來(lái)提升算法的性能表現(xiàn)
4. 機(jī)器學(xué)習(xí)所處的位置
①傳統(tǒng)編程:軟件工程師編寫(xiě)程序來(lái)解決問(wèn)題暖璧。首先存在一些數(shù)據(jù)→為了解決一個(gè)問(wèn)題案怯,軟件工程師編寫(xiě)一個(gè)流程來(lái)告訴機(jī)器應(yīng)該怎樣做→計(jì)算機(jī)遵照這一流程執(zhí)行,然后得出結(jié)果
②統(tǒng)計(jì)學(xué):分析師比較變量之間的關(guān)系
③機(jī)器學(xué)習(xí):數(shù)據(jù)科學(xué)家使用訓(xùn)練數(shù)據(jù)集來(lái)教計(jì)算機(jī)應(yīng)該怎么做澎办,然后系統(tǒng)執(zhí)行該任務(wù)嘲碱。首先存在大數(shù)據(jù)→機(jī)器會(huì)學(xué)習(xí)使用訓(xùn)練數(shù)據(jù)集來(lái)進(jìn)行分類,調(diào)節(jié)特定的算法來(lái)實(shí)現(xiàn)目標(biāo)分類→該計(jì)算機(jī)可學(xué)習(xí)識(shí)別數(shù)據(jù)中的關(guān)系局蚀、趨勢(shì)和模式
④智能應(yīng)用:智能應(yīng)用使用人工智能所得到的結(jié)果麦锯,如圖是一個(gè)精準(zhǔn)農(nóng)業(yè)的應(yīng)用案例示意,該應(yīng)用基于無(wú)人機(jī)所收集到的數(shù)據(jù)
5. 機(jī)器學(xué)習(xí)的實(shí)際應(yīng)用
機(jī)器學(xué)習(xí)有很多應(yīng)用場(chǎng)景琅绅,這里給出了一些示例扶欣,你會(huì)怎么使用它?
快速三維地圖測(cè)繪和建模:要建造一架鐵路橋千扶,PwC的數(shù)據(jù)科學(xué)家和領(lǐng)域?qū)<覍C(jī)器學(xué)習(xí)應(yīng)用到了無(wú)人機(jī)收集到的數(shù)據(jù)上料祠。這種組合實(shí)現(xiàn)了工作成功中的精準(zhǔn)監(jiān)控和快速反饋。
增強(qiáng)分析以降低風(fēng)險(xiǎn):為了檢測(cè)內(nèi)部交易澎羞,PwC將機(jī)器學(xué)習(xí)和其它分析技術(shù)結(jié)合了起來(lái)髓绽,從而開(kāi)發(fā)了更為全面的用戶概況,并且獲得了對(duì)復(fù)雜可疑行為的更深度了解妆绞。
預(yù)測(cè)表現(xiàn)最佳的目標(biāo):PwC使用機(jī)器學(xué)習(xí)和其它分析方法來(lái)評(píng)估Melbourne Cup賽場(chǎng)上不同賽馬的潛力顺呕。
二枫攀、機(jī)器學(xué)習(xí)的演化
幾十年來(lái),人工智能研究者的各個(gè)「部落」一直以來(lái)都在彼此爭(zhēng)奪主導(dǎo)權(quán)株茶,參閱機(jī)器之心文章《華盛頓大學(xué)教授 Pedro Domingos:機(jī)器學(xué)習(xí)領(lǐng)域五大流派(附演講 ppt)》±凑牵現(xiàn)在是這些部落聯(lián)合起來(lái)的時(shí)候了嗎?他們也可能不得不這樣做忌卤,因?yàn)楹献骱退惴ㄈ诤鲜菍?shí)現(xiàn)真正通用人工智能(AGI)的唯一方式扫夜。這里給出了機(jī)器學(xué)習(xí)方法的演化之路以及未來(lái)的可能模樣。擴(kuò)展閱讀《深度 | 深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)全局概覽:核心技術(shù)的發(fā)展歷程》驰徊。
1.五大流派
①符號(hào)主義:使用符號(hào)、規(guī)則和邏輯來(lái)表征知識(shí)和進(jìn)行邏輯推理堕阔,最喜歡的算法是:規(guī)則和決策樹(shù)
②貝葉斯派:獲取發(fā)生的可能性來(lái)進(jìn)行概率推理棍厂,最喜歡的算法是:樸素貝葉斯或馬爾可夫
③聯(lián)結(jié)主義:使用概率矩陣和加權(quán)神經(jīng)元來(lái)動(dòng)態(tài)地識(shí)別和歸納模式,最喜歡的算法是:神經(jīng)網(wǎng)絡(luò)
④進(jìn)化主義:生成變化超陆,然后為特定目標(biāo)獲取其中最優(yōu)的牺弹,最喜歡的算法是:遺傳算法
⑤Analogizer:根據(jù)約束條件來(lái)優(yōu)化函數(shù)(盡可能走到更高,但同時(shí)不要離開(kāi)道路)时呀,最喜歡的算法是:支持向量機(jī).
2.演化的階段
1980 年代
主導(dǎo)流派:符號(hào)主義
架構(gòu):服務(wù)器或大型機(jī)
主導(dǎo)理論:知識(shí)工程
基本決策邏輯:決策支持系統(tǒng)张漂,實(shí)用性有限
1990 年代到 2000 年
主導(dǎo)流派:貝葉斯
架構(gòu):小型服務(wù)器集群
主導(dǎo)理論:概率論
分類:可擴(kuò)展的比較或?qū)Ρ龋瑢?duì)許多任務(wù)都足夠好了
2010 年代早期到中期
主導(dǎo)流派:聯(lián)結(jié)主義
架構(gòu):大型服務(wù)器農(nóng)場(chǎng)
主導(dǎo)理論:神經(jīng)科學(xué)和概率
識(shí)別:更加精準(zhǔn)的圖像和聲音識(shí)別谨娜、翻譯航攒、情緒分析等
3.這些流派有望合作,并將各自的方法融合到一起
2010 年代末期
主導(dǎo)流派:聯(lián)結(jié)主義+符號(hào)主義
架構(gòu):許多云
主導(dǎo)理論:記憶神經(jīng)網(wǎng)絡(luò)趴梢、大規(guī)模集成漠畜、基于知識(shí)的推理
簡(jiǎn)單的問(wèn)答:范圍狹窄的、領(lǐng)域特定的知識(shí)共享
2020 年代+
主導(dǎo)流派:聯(lián)結(jié)主義+符號(hào)主義+貝葉斯+……
架構(gòu):云計(jì)算和霧計(jì)算
主導(dǎo)理論:感知的時(shí)候有網(wǎng)絡(luò)坞靶,推理和工作的時(shí)候有規(guī)則
簡(jiǎn)單感知憔狞、推理和行動(dòng):有限制的自動(dòng)化或人機(jī)交互
2040 年代+
主導(dǎo)流派:算法融合
架構(gòu):無(wú)處不在的服務(wù)器
主導(dǎo)理論:最佳組合的元學(xué)習(xí)
感知和響應(yīng):基于通過(guò)多種學(xué)習(xí)方式獲得的知識(shí)或經(jīng)驗(yàn)采取行動(dòng)或做出回答
三、機(jī)器學(xué)習(xí)的算法
你應(yīng)該使用哪種機(jī)器學(xué)習(xí)算法彰阴?這在很大程度上依賴于可用數(shù)據(jù)的性質(zhì)和數(shù)量以及每一個(gè)特定用例中你的訓(xùn)練目標(biāo)瘾敢。不要使用最復(fù)雜的算法,除非其結(jié)果值得付出昂貴的開(kāi)銷和資源尿这。這里給出了一些最常見(jiàn)的算法簇抵,按使用簡(jiǎn)單程度排序。更多內(nèi)容可參閱機(jī)器之心的文章《機(jī)器學(xué)習(xí)算法集錦:從貝葉斯到深度學(xué)習(xí)及各自優(yōu)缺點(diǎn)》和《經(jīng)驗(yàn)之談:如何為你的機(jī)器學(xué)習(xí)問(wèn)題選擇合適的算法妻味?》
1. 決策樹(shù)(Decision Tree):在進(jìn)行逐步應(yīng)答過(guò)程中正压,典型的決策樹(shù)分析會(huì)使用分層變量或決策節(jié)點(diǎn),例如责球,可將一個(gè)給定用戶分類成信用可靠或不可靠焦履。
優(yōu)點(diǎn):擅長(zhǎng)對(duì)人拓劝、地點(diǎn)、事物的一系列不同特征嘉裤、品質(zhì)郑临、特性進(jìn)行評(píng)估
場(chǎng)景舉例:基于規(guī)則的信用評(píng)估、賽馬結(jié)果預(yù)測(cè)
擴(kuò)展閱讀:《教程 | 從頭開(kāi)始:用Python實(shí)現(xiàn)決策樹(shù)算法》屑宠、《想了解概率圖模型厢洞?你要先理解圖論的基本定義與形式》
2. 支持向量機(jī)(Support Vector Machine):基于超平面(hyperplane),支持向量機(jī)可以對(duì)數(shù)據(jù)群進(jìn)行分類典奉。
優(yōu)點(diǎn):支持向量機(jī)擅長(zhǎng)在變量 X 與其它變量之間進(jìn)行二元分類操作躺翻,無(wú)論其關(guān)系是否是線性的
場(chǎng)景舉例:新聞分類、手寫(xiě)識(shí)別卫玖。
擴(kuò)展閱讀:《干貨 | 詳解支持向量機(jī)(附學(xué)習(xí)資源)》
3. 回歸(Regression):回歸可以勾畫(huà)出因變量與一個(gè)或多個(gè)因變量之間的狀態(tài)關(guān)系公你。在這個(gè)例子中,將垃圾郵件和非垃圾郵件進(jìn)行了區(qū)分假瞬。
優(yōu)點(diǎn):回歸可用于識(shí)別變量之間的連續(xù)關(guān)系陕靠,即便這個(gè)關(guān)系不是非常明顯
場(chǎng)景舉例:路面交通流量分析、郵件過(guò)濾
4. 樸素貝葉斯分類(Naive Bayes Classification):樸素貝葉斯分類器用于計(jì)算可能條件的分支概率脱茉。每個(gè)獨(dú)立的特征都是「樸素」或條件獨(dú)立的剪芥,因此它們不會(huì)影響別的對(duì)象。例如琴许,在一個(gè)裝有共 5 個(gè)黃色和紅色小球的罐子里税肪,連續(xù)拿到兩個(gè)黃色小球的概率是多少?從圖中最上方分支可見(jiàn)虚吟,前后抓取兩個(gè)黃色小球的概率為 1/10寸认。樸素貝葉斯分類器可以計(jì)算多個(gè)特征的聯(lián)合條件概率。
優(yōu)點(diǎn):對(duì)于在小數(shù)據(jù)集上有顯著特征的相關(guān)對(duì)象串慰,樸素貝葉斯方法可對(duì)其進(jìn)行快速分類
場(chǎng)景舉例:情感分析偏塞、消費(fèi)者分類
5. 隱馬爾可夫模型(Hidden Markov model):顯馬爾可夫過(guò)程是完全確定性的——一個(gè)給定的狀態(tài)經(jīng)常會(huì)伴隨另一個(gè)狀態(tài)。交通信號(hào)燈就是一個(gè)例子邦鲫。相反灸叼,隱馬爾可夫模型通過(guò)分析可見(jiàn)數(shù)據(jù)來(lái)計(jì)算隱藏狀態(tài)的發(fā)生。隨后庆捺,借助隱藏狀態(tài)分析古今,隱馬爾可夫模型可以估計(jì)可能的未來(lái)觀察模式。在本例中滔以,高或低氣壓的概率(這是隱藏狀態(tài))可用于預(yù)測(cè)晴天捉腥、雨天、多云天的概率你画。
優(yōu)點(diǎn):容許數(shù)據(jù)的變化性抵碟,適用于識(shí)別(recognition)和預(yù)測(cè)操作
場(chǎng)景舉例:面部表情分析桃漾、氣象預(yù)測(cè)
6. 隨機(jī)森林(Random forest):隨機(jī)森林算法通過(guò)使用多個(gè)帶有隨機(jī)選取的數(shù)據(jù)子集的樹(shù)(tree)改善了決策樹(shù)的精確性。本例在基因表達(dá)層面上考察了大量與乳腺癌復(fù)發(fā)相關(guān)的基因拟逮,并計(jì)算出復(fù)發(fā)風(fēng)險(xiǎn)撬统。
優(yōu)點(diǎn):隨機(jī)森林方法被證明對(duì)大規(guī)模數(shù)據(jù)集和存在大量且有時(shí)不相關(guān)特征的項(xiàng)(item)來(lái)說(shuō)很有用
場(chǎng)景舉例:用戶流失分析、風(fēng)險(xiǎn)評(píng)估
擴(kuò)展閱讀:《教程 | 從頭開(kāi)始:用 Python 實(shí)現(xiàn)隨機(jī)森林算法》
7. 循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network):在任意神經(jīng)網(wǎng)絡(luò)中敦迄,每個(gè)神經(jīng)元都通過(guò) 1 個(gè)或多個(gè)隱藏層來(lái)將很多輸入轉(zhuǎn)換成單個(gè)輸出恋追。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)會(huì)將值進(jìn)一步逐層傳遞,讓逐層學(xué)習(xí)成為可能罚屋。換句話說(shuō)苦囱,RNN 存在某種形式的記憶,允許先前的輸出去影響后面的輸入沿后。
優(yōu)點(diǎn):循環(huán)神經(jīng)網(wǎng)絡(luò)在存在大量有序信息時(shí)具有預(yù)測(cè)能力
場(chǎng)景舉例:圖像分類與字幕添加沿彭、政治情感分析
8. 長(zhǎng)短期記憶(Long short-term memory,LSTM)與門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(gated recurrent unit nerual network):早期的 RNN 形式是會(huì)存在損耗的尖滚。盡管這些早期循環(huán)神經(jīng)網(wǎng)絡(luò)只允許留存少量的早期信息,新近的長(zhǎng)短期記憶(LSTM)與門控循環(huán)單元(GRU)神經(jīng)網(wǎng)絡(luò)都有長(zhǎng)期與短期的記憶瞧柔。換句話說(shuō)漆弄,這些新近的 RNN 擁有更好的控制記憶的能力,允許保留早先的值或是當(dāng)有必要處理很多系列步驟時(shí)重置這些值造锅,這避免了「梯度衰減」或逐層傳遞的值的最終 degradation撼唾。LSTM 與 GRU 網(wǎng)絡(luò)使得我們可以使用被稱為「門(gate)」的記憶模塊或結(jié)構(gòu)來(lái)控制記憶,這種門可以在合適的時(shí)候傳遞或重置值哥蔚。
優(yōu)點(diǎn):長(zhǎng)短期記憶和門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)具備與其它循環(huán)神經(jīng)網(wǎng)絡(luò)一樣的優(yōu)點(diǎn)倒谷,但因?yàn)樗鼈冇懈玫挠洃浤芰Γ愿1皇褂?/p>
場(chǎng)景舉例:自然語(yǔ)言處理糙箍、翻譯
擴(kuò)展閱讀:《深度 | LSTM 和遞歸網(wǎng)絡(luò)基礎(chǔ)教程》和《干貨 | 圖解 LSTM 神經(jīng)網(wǎng)絡(luò)架構(gòu)及其 11 種變體(附論文)》
9. 卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network):卷積是指來(lái)自后續(xù)層的權(quán)重的融合渤愁,可用于標(biāo)記輸出層。
優(yōu)點(diǎn):當(dāng)存在非常大型的數(shù)據(jù)集深夯、大量特征和復(fù)雜的分類任務(wù)時(shí)抖格,卷積神經(jīng)網(wǎng)絡(luò)是非常有用的
場(chǎng)景舉例:圖像識(shí)別、文本轉(zhuǎn)語(yǔ)音咕晋、藥物發(fā)現(xiàn)
擴(kuò)展閱讀:《專欄 | 卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介》雹拄、《從入門到精通:卷積神經(jīng)網(wǎng)絡(luò)初學(xué)者指南》和《解析深度卷積神經(jīng)網(wǎng)絡(luò)的 14 種設(shè)計(jì)模式》