機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支呕缭,通過(guò)構(gòu)建算法讓計(jì)算機(jī)學(xué)習(xí)嘱巾,并在數(shù)據(jù)集上使用學(xué)習(xí)到的算法完成某種任務(wù)齐邦。正式的定義是:對(duì)于某類任務(wù)T和性能度量P,? 如果一個(gè)計(jì)算機(jī)程序在T上以P度量的性能隨著經(jīng)驗(yàn)E(訓(xùn)練樣例)而自我完善演侯,那么我們稱這個(gè)計(jì)算機(jī)程序在從經(jīng)驗(yàn)E學(xué)習(xí)炕吸。
機(jī)器學(xué)習(xí)的常見應(yīng)用可以分為以下四大類:
圖像處理:通過(guò)分析圖像獲取數(shù)據(jù)或者做一些轉(zhuǎn)換伐憾。
1、圖像標(biāo)記:如算法可以自動(dòng)從照片中檢測(cè)出人臉赫模,基本上是機(jī)器學(xué)習(xí)算法從手動(dòng)標(biāo)記的圖片中學(xué)習(xí)树肃。
2、光學(xué)字符識(shí)別(OCR):算法將手稿或者掃描文本轉(zhuǎn)換為數(shù)字化版本瀑罗,算法需要學(xué)會(huì)將手寫字符圖像轉(zhuǎn)化成相應(yīng)的數(shù)字化字母胸嘴。
3、自動(dòng)駕駛汽車:讓汽車通過(guò)圖像處理來(lái)自動(dòng)駕駛廓脆,機(jī)器學(xué)習(xí)算法通過(guò)攝像機(jī)拍攝的每一幀圖像來(lái)學(xué)習(xí)哪里是道路的邊緣筛谚,是否有停車標(biāo)志或者是否有車靠近。
文本分析:從文本文件停忿,如郵件驾讲、聊天記錄、文檔中提取或者分類信息席赂。
1吮铭、垃圾郵件過(guò)濾:文本分類的應(yīng)用之一,學(xué)習(xí)如何基于內(nèi)容和主題將郵件歸為垃圾郵件颅停。
2谓晌、情感分析:文本分類的另一個(gè)應(yīng)用,算法需要學(xué)會(huì)基于作者表達(dá)的情緒癞揉,來(lái)將一個(gè)觀點(diǎn)分類成積極纸肉、中立或者消極。
3喊熟、信息提劝胤尽:從文本中,學(xué)會(huì)提取特定的信息或數(shù)據(jù)塊芥牌,如地址烦味、實(shí)體、關(guān)鍵詞等壁拉。
數(shù)據(jù)挖掘:從數(shù)據(jù)中發(fā)現(xiàn)某些模式或者做出預(yù)測(cè)谬俄。也就是從海量的數(shù)據(jù)庫(kù)中挖掘有用的信息柏靶。每一行都可以是訓(xùn)練實(shí)例,每一列都可以作為一個(gè)特征溃论∈候眩可能會(huì)用表中剩余的列來(lái)預(yù)測(cè)一條新的列,或者發(fā)現(xiàn)某種模式來(lái)對(duì)行進(jìn)行分組蔬芥。
1梆靖、異常檢測(cè):檢測(cè)異常值,如信用卡的欺詐檢測(cè)笔诵,可以從用戶平常的購(gòu)物模式來(lái)檢測(cè)哪些購(gòu)物方式是異常行為。
2姑子、關(guān)聯(lián)規(guī)則:在超市或者電子商務(wù)網(wǎng)站乎婿,可以通過(guò)觀察哪些產(chǎn)品會(huì)一起購(gòu)買來(lái)發(fā)現(xiàn)用戶的購(gòu)買習(xí)慣,可以用于營(yíng)銷輔助街佑。
3谢翎、分組:可以通過(guò)用戶行為和資料來(lái)對(duì)用戶進(jìn)行分組。
4沐旨、預(yù)測(cè):從剩余變量中預(yù)測(cè)出另一個(gè)變量(數(shù)據(jù)庫(kù)中的一列)森逮,如可以通過(guò)對(duì)現(xiàn)有客戶資料和信用評(píng)分這些信息來(lái)學(xué)習(xí)并預(yù)測(cè)新客戶的信用評(píng)分。
視頻游戲與機(jī)器人
一般來(lái)說(shuō)我們有一個(gè)Agent(游戲角色或者機(jī)器人)磁携,它必須根據(jù)環(huán)境(視頻游戲中的虛擬環(huán)境或者對(duì)于機(jī)器人來(lái)說(shuō)的真實(shí)環(huán)境)來(lái)行動(dòng)褒侧。機(jī)器學(xué)習(xí)可以使這個(gè)Agent執(zhí)行任務(wù),比如移動(dòng)到某個(gè)環(huán)境中而同時(shí)避開障礙或者機(jī)器人谊迄。在這些情形下一個(gè)最受歡迎的機(jī)器學(xué)習(xí)技術(shù)是強(qiáng)化學(xué)習(xí)闷供,Agent通過(guò)學(xué)習(xí)環(huán)境的強(qiáng)化系數(shù)(如果Agent碰到了障礙物強(qiáng)化系數(shù)為負(fù),如果達(dá)到目標(biāo)為正)來(lái)執(zhí)行任務(wù)统诺。
機(jī)器學(xué)習(xí)算法的種類
監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)歪脏,兩類的區(qū)別在于提供給算法的訓(xùn)練樣例。
監(jiān)督學(xué)習(xí):可以看做將特定輸入轉(zhuǎn)換成期望輸出的過(guò)程粮呢,機(jī)器學(xué)習(xí)需要學(xué)會(huì)如何將所有可能輸入轉(zhuǎn)化成正確/期望輸出婿失,所以每個(gè)訓(xùn)練樣例都有特定的輸入和期望輸出,根據(jù)輸出的不同又可以分為兩個(gè)小類:分類和回歸啄寡,瓶頸在于收集正確標(biāo)記的訓(xùn)練數(shù)據(jù)豪硅。
非監(jiān)督學(xué)習(xí):訓(xùn)練數(shù)據(jù)只需要輸入到算法中即可,不需要對(duì)應(yīng)的期望輸出这难。典型的用例就是發(fā)現(xiàn)訓(xùn)練樣例之間隱藏的結(jié)構(gòu)或者關(guān)系舟误,典型的應(yīng)用就是聚類算法。
機(jī)器學(xué)習(xí)算法
支持向量機(jī):試圖構(gòu)建一個(gè)超平面高維空間集姻乓,它試圖通過(guò)計(jì)算與最近實(shí)例最大距離來(lái)區(qū)分不同類的實(shí)現(xiàn)嵌溢。
概率模型:這類模型通常通過(guò)對(duì)問(wèn)題進(jìn)行概率分布建模來(lái)預(yù)測(cè)正確的響應(yīng)眯牧。這類算法中最流行的就是樸素貝葉斯分類器,它使用貝葉斯定理和特征之間的獨(dú)立性假設(shè)來(lái)構(gòu)建分類器赖草,優(yōu)勢(shì)是簡(jiǎn)單卻強(qiáng)大学少,不僅會(huì)返回預(yù)測(cè)值還會(huì)返回預(yù)測(cè)值得確定度。
深度學(xué)習(xí):由一組相互關(guān)聯(lián)的神經(jīng)元組成秧骑,這些神經(jīng)元被組織成許多層版确,深度學(xué)習(xí)使用更深的層構(gòu)建了新的結(jié)構(gòu),通過(guò)高層次抽象改進(jìn)了算法乎折,不僅改進(jìn)了學(xué)習(xí)方式绒疗,而且構(gòu)建了自動(dòng)表示最重要特征的結(jié)構(gòu)。