姓名:王咫毅
學(xué)號:19021211150
【嵌牛導(dǎo)讀】隨著人工智能的興起充蓝,深度學(xué)習(xí)和機器學(xué)習(xí)的影響力日益增加芽突。但是這兩者又有什么區(qū)別呢忧便?深度學(xué)習(xí)又是怎么來的呢青灼?能解決什么機器學(xué)習(xí)解決不了的問題呢?
【嵌牛鼻子】機器學(xué)習(xí) 深度學(xué)習(xí)
【嵌牛提問】深度學(xué)習(xí)和機器學(xué)習(xí)的區(qū)別與聯(lián)系是什么辽旋?
【嵌牛正文】
轉(zhuǎn)載自:機器學(xué)習(xí)和深度學(xué)習(xí)區(qū)別的簡要概述 - 簡書
深度學(xué)習(xí)與機器學(xué)習(xí) - 您需要了解的基本差異硬鞍!
介紹
機器學(xué)習(xí)和深度學(xué)習(xí)現(xiàn)在風(fēng)靡一時!好像就是發(fā)生在一瞬間戴已,每個人都在談?wù)撝鼈?- 無論人們是否理解兩者中間的差異固该!現(xiàn)在人們無論是否關(guān)注數(shù)據(jù)科學(xué) - 都會聽到過這兩個術(shù)語。
現(xiàn)在展示一下深度學(xué)習(xí)和機器學(xué)習(xí)所獲得的關(guān)注度糖儡,以下是這些關(guān)鍵字的Google趨勢:
關(guān)注度
如果你想了解機器學(xué)習(xí)和深度學(xué)習(xí)之間的區(qū)別伐坏,請繼續(xù)閱讀這篇以簡單的外行語言進行詳細(xì)比較機器學(xué)習(xí)和深度學(xué)習(xí)的文章。我將會詳細(xì)的解釋這些術(shù)語握联。然后比較它們并解釋我們可以在什么地方會用到它們桦沉。
如果你想了解機器學(xué)習(xí)和深度學(xué)習(xí)之間的區(qū)別,請繼續(xù)閱讀這篇以簡單的外行語言進行詳細(xì)比較機器學(xué)習(xí)和深度學(xué)習(xí)的文章金闽。我將會詳細(xì)的解釋這些術(shù)語纯露。然后比較它們并解釋我們可以在什么地方會用到它們。
1.什么是機器學(xué)習(xí)和深度學(xué)習(xí)
讓我們從基礎(chǔ)的知識開始開始說起 - 什么是機器學(xué)習(xí)和什么是深度學(xué)習(xí)代芜。如果你已經(jīng)知道這一點埠褪,那可以跳過這一部分,直接去看第二部分挤庇,兩種學(xué)習(xí)之間的比較钞速。
1.1什么是機器學(xué)習(xí)?
Tom Mitchell廣泛引用的機器學(xué)習(xí)定義就很好的解釋了機器學(xué)習(xí)嫡秕。這就是它所說的:
“據(jù)說計算機程序可以從經(jīng)驗E中學(xué)習(xí)某些類型的任務(wù)T和用來測試的P渴语,它在T中的任務(wù)中的表現(xiàn)(由P測試)會隨著經(jīng)驗E的提高而提高”
這聽起來很令人費解或令人困惑對吧?那讓我們用簡單的例子來分析一下昆咽。
案例1 - 機器學(xué)習(xí) - 根據(jù)高度預(yù)測權(quán)重
假設(shè)現(xiàn)在需要創(chuàng)建一個系統(tǒng)驾凶,該系統(tǒng)根據(jù)人的身高來顯示預(yù)測的體重≈佬铮可能有幾個原因會讓人對這個系統(tǒng)感興趣调违。因為我們可以使用它來過濾掉任何可能的欺詐或者獲取數(shù)據(jù)的錯誤。首先要做的第一件事就是收集數(shù)據(jù)汇在。假設(shè)我們現(xiàn)在的數(shù)據(jù)是這樣子的:
身高數(shù)據(jù)
圖表上的每個點代表一個數(shù)據(jù)點翰萨。首先脏答,我們可以畫一條簡單的線來預(yù)測基于身高的體重糕殉。舉一個簡單的例子:
體重(kg)=身高(cm) - 100
這樣可以幫助我們做出預(yù)測亩鬼。雖然這條預(yù)測線做得不錯,但我們需要了解它的表現(xiàn)阿蝶。在這種情況下,我們可以說我們希望減少預(yù)測值和實際值之間的差異。這就是衡量績效的方法谣沸。
此外苛蒲,我們收集的數(shù)據(jù)點越多(經(jīng)驗),我們的模型就越好筑煮。我們還可以通過添加更多變量(例如性別)并為它們創(chuàng)建不同的預(yù)測線來改進我們的模型辛蚊。
案例2 - 風(fēng)暴預(yù)測系統(tǒng)
讓我們舉一個稍微復(fù)雜一點的例子。假設(shè)現(xiàn)在需要構(gòu)建一個風(fēng)暴預(yù)測系統(tǒng)真仲。通過過去發(fā)生的所有風(fēng)暴的數(shù)據(jù)袋马,以及這些風(fēng)暴發(fā)生前三個月的天氣狀況。
考慮到這些秸应,如果我們要手動建立一個風(fēng)暴預(yù)測系統(tǒng)虑凛,我們需要做什么?
風(fēng)暴預(yù)測
我們首先必須檢查所有的數(shù)據(jù),并找到這些數(shù)據(jù)中的模式软啼。我們的任務(wù)是尋找導(dǎo)致風(fēng)暴的條件桑谍。
我們可以模擬這樣的條件,如果溫度大于40攝氏度祸挪,濕度在80到100之間等等锣披。然后手動將這些'條件'輸入到我們的系統(tǒng)。
或者贿条,我們可以讓我們的系統(tǒng)在數(shù)據(jù)中了解到這些特征的適當(dāng)值盈罐。
現(xiàn)在要找到這些值,需要瀏覽所有之前的數(shù)據(jù)闪唆,并嘗試預(yù)測是否會有風(fēng)暴盅粪。根據(jù)系統(tǒng)設(shè)置的特征值,我們評估系統(tǒng)的性能悄蕾,就是系統(tǒng)正確預(yù)測風(fēng)暴發(fā)生的次數(shù)票顾。我們可以對上述步驟進一步多次迭代,將性能作為反饋給我們的系統(tǒng)帆调。
讓我們采用我們的正式定義來嘗試定義我們的風(fēng)暴預(yù)測系統(tǒng):我們的任務(wù)“T”是找出引發(fā)風(fēng)暴的大氣條件奠骄。性能“P”是在提供給系統(tǒng)的所有條件中,正確預(yù)測風(fēng)暴的次數(shù)番刊。經(jīng)驗'E'是我們系統(tǒng)的重復(fù)模擬含鳞。
1.2什么是深度學(xué)習(xí)?
深度學(xué)習(xí)的概念并不新鮮蝉绷。它已經(jīng)存在好幾年了。但是現(xiàn)在隨著不斷的炒作熔吗,深度學(xué)習(xí)越來越受到關(guān)注。正如我們在機器學(xué)習(xí)中所做的那樣桅狠,我們先研究深度學(xué)習(xí)的正式定義讼载,然后通過例子對深度學(xué)習(xí)分解認(rèn)識中跌。
“深度學(xué)習(xí)是一種特殊的機器學(xué)習(xí),它通過學(xué)習(xí)將世界表示為嵌套的概念層次結(jié)構(gòu)來實現(xiàn)強大的功能和靈活性漩符,每個概念都是根據(jù)更簡單的概念進行定義的吱型,而更抽象的表示則用不那么抽象的概念計算出來。 ”
這些概念同樣會讓人困惑不已〗蛑停現(xiàn)在讓我們用簡單的例子來認(rèn)識它灼伤。
案例1 - 形狀檢測
讓我從一個簡單的例子開始,它解釋了在概念層面上事情是如何發(fā)生的撞鹉。讓我們試著理解如何識別其他形狀的正方形颖侄。
形狀檢測
我們眼睛做的第一件事就是檢查是否有4條線與一個圖形相關(guān)聯(lián)的簡單概念。如果我們找到4條線孝鹊,我們進一步檢查它們是否連接展蒂,閉合锰悼,垂直以及它們是否相等(概念的嵌套層次結(jié)構(gòu))。
因此耐薯,我們采取了一項復(fù)雜的任務(wù)(確定一個正方形)并將其分解為簡單的、不那么抽象的東西体谒。深度學(xué)習(xí)在很大程度上就是這么做的
案例2 - 貓還是狗
讓我們舉一個動物識別器的例子复斥,我們的系統(tǒng)必須識別給的圖片是貓還是狗械媒。
貓還是狗
如果我們將此作為一個典型的機器學(xué)習(xí)問題的話,我們必須定義一些特征痢虹,諸如動物是否有胡須奖唯,是否有耳朵如果有耳朵糜值,那么耳朵是尖的還是稍微圓一點的。簡單點說病往,我們要定義面部特征骄瓣,讓系統(tǒng)識別哪些特征在對特定動物進行分類時比較重要榕栏。
現(xiàn)在,深度學(xué)習(xí)就比機器學(xué)習(xí)領(lǐng)先一步庆揪。深度學(xué)習(xí)會自動找出對分類很重要的特征妨托,在機器學(xué)習(xí)中我們必須手動提供這些特征。深度學(xué)習(xí)的工作原理如下:
它首先確定那些特征與分辨出是貓還是狗最有相關(guān)性
然后仔掸,它以層次結(jié)構(gòu)為基礎(chǔ)医清,找到可以找到的特征的組合。例如负懦,是否存在胡須纸厉,或是否存在耳朵等。
在對復(fù)雜概念進行連續(xù)層次識別之后肯尺,它決定通過哪個特征負(fù)責(zé)來找到答案躯枢。
2.機器學(xué)習(xí)與深度學(xué)習(xí)的比較
既然現(xiàn)在你已經(jīng)了解了機器學(xué)習(xí)和深度學(xué)習(xí)的基本概念锄蹂,那我們接下來要用一些重要的觀點來比較一下這兩種技術(shù)。
2.1數(shù)據(jù)依賴
深度學(xué)習(xí)與傳統(tǒng)機器學(xué)習(xí)之間最重要的區(qū)別會隨著數(shù)據(jù)規(guī)模的增大而表現(xiàn)出來敬扛。當(dāng)數(shù)據(jù)很小時朝抖,深度學(xué)習(xí)算法表現(xiàn)不佳槽棍。這是因為深度學(xué)習(xí)算法需要大量數(shù)據(jù)才能完美理解它。另一方面缆巧,傳統(tǒng)的機器學(xué)習(xí)算法及其手工制作的規(guī)則在這種情況下占據(jù)優(yōu)勢豌拙。下圖總結(jié)了這一事實按傅。
數(shù)據(jù)依賴
2.2硬件依賴性
深度學(xué)習(xí)算法在很大程度上依賴于高端機器,這與傳統(tǒng)的機器學(xué)習(xí)算法相反拼岳,后者可以在低端機器上運行况芒。這是因為深度學(xué)習(xí)算法的要求包括GPU,因為GPU是其工作中不可或缺的組成部分祠够。深度學(xué)習(xí)算法本質(zhì)上是做大量的矩陣乘法運算粪牲,而使用GPU可以有效的優(yōu)化這些操作,而這就是使用GPU的目的落君。
2.3特征工程
特征工程是將領(lǐng)域知識放入特征提取器的創(chuàng)建過程叽奥,用來降低數(shù)據(jù)的復(fù)雜性并使特征對于學(xué)習(xí)算法更加可見痛侍。就時間和專業(yè)知識而言魔市,這個過程是困難而又昂貴的待德。
在機器學(xué)習(xí)中,大多數(shù)應(yīng)用的特征需要由專家識別绘闷,然后根據(jù)領(lǐng)域和數(shù)據(jù)類型進行手動編碼较坛。
例如丑勤,特征可以是像素值,形狀耙厚,紋理岔霸,位置和方向。大多數(shù)機器學(xué)習(xí)算法的性能取決于特征識別和特征提取的準(zhǔn)確程度泛豪。
深度學(xué)習(xí)算法嘗試從數(shù)據(jù)中學(xué)習(xí)高級特征诡曙。這是深度學(xué)習(xí)一個非常獨特的部分,也是超越傳統(tǒng)機器學(xué)習(xí)的重要部分劝萤。因此慎璧,深度學(xué)習(xí)減少了為每個問題開發(fā)新的特征提取器的任務(wù)胸私。就像,卷積神經(jīng)網(wǎng)絡(luò)將嘗試先學(xué)習(xí)底層特征阔涉,例如早期圖層中的邊緣和線條捷绒,然后是人臉的部分面部,最后是高級的面部識別椭住。
特征工程
2.4問題解決方法
當(dāng)使用傳統(tǒng)的機器學(xué)習(xí)算法解決問題時京郑,通常建議將問題分解為不同的部分葫掉,分別解開這些問題挖息,然后將它們組合起來得到結(jié)果。相反绪抛,深度學(xué)習(xí)主張從頭到尾的解決問題电禀。
我們舉一個例子來理解這一點尖飞。
假設(shè)現(xiàn)在有一個多個對象檢測的任務(wù)店雅。任務(wù)是確定對象是什么以及它在圖像中的位置闹啦。
圖像識別
在典型的機器學(xué)習(xí)方法中窍奋,可以將問題分為兩個步驟:對象檢測和對象識別酱畅。首先纺酸,您將使用像grabcut這樣的邊界框檢測算法來瀏覽圖像并查找所有可能的對象。然后碎紊,在所有已識別的對象中用含,您將使用對象識別算法(如帶有HOG的SVM)來識別相關(guān)對象啄骇。
相反瘟斜,在深度學(xué)習(xí)方法中,只需要從頭到尾的完成這個過程虽惭。例如芽唇,在YOLO net(這是一種深度學(xué)習(xí)算法)中取劫,傳入這張圖像谱邪,它將給出對象存在的位置以及對象的名稱。
2.5執(zhí)行時間
通常咆课,深度學(xué)習(xí)算法需要很長時間來訓(xùn)練。這是因為深度學(xué)習(xí)算法中有很多的參數(shù)喇澡,所以訓(xùn)練它們需要更長的時間撩幽。最先進的深度學(xué)習(xí)算法ResNet需要大約兩周時間才能完全從0開始的訓(xùn)練箩艺。相比之下艺谆,機器學(xué)習(xí)的訓(xùn)練時間要短得多,從幾秒鐘到幾小時不等琅催。
測試時間完全顛倒了虫给。在測試時抹估,深度學(xué)習(xí)算法運行的時間要少得多。然而瓷式,如果把它與k近鄰(一種機器學(xué)習(xí)算法)進行比較语泽,則測試時間會隨著數(shù)據(jù)的增加而增加踱卵。雖然這不適用于所有機器學(xué)習(xí)算法,因為有些算法的測試時間也會很短妒挎。
2.6可解釋性
最后一點但并非不重要的是饥漫,我們將可解釋性作為比較機器學(xué)習(xí)和深度學(xué)習(xí)的一個因素罗标。這個因素是深度學(xué)習(xí)在用于行業(yè)之前仍被反復(fù)思考的主要原因。
我們來舉個例子吧竿拆。假設(shè)我們使用深度學(xué)習(xí)自動為論文打評分宾尚。它在打分方面的表現(xiàn)的非常出色煌贴,接近人類的表現(xiàn)。但有一個問題怠肋。它沒有透露出為什么它給出了這個分?jǐn)?shù)淹朋。事實上础芍,你可以通過數(shù)學(xué)方法找出深層神經(jīng)網(wǎng)絡(luò)的哪些節(jié)點被激活,但我們不知道這些神經(jīng)元是怎么建模的惶楼,以及這些神經(jīng)元做了什么鲫懒。所以我們無法解釋結(jié)果刽辙。
另一方面宰缤,像決策樹這樣的機器學(xué)習(xí)算法為我們提供了清晰的規(guī)則晃洒,解釋了為什么要選擇這個內(nèi)容球及,因此特別容易理解其背后的原理。因此筹陵,像決策樹和線性/邏輯回歸等算法主要用于行業(yè)中就是因為其結(jié)果的可解釋性朦佩。
3.機器學(xué)習(xí)和深度學(xué)習(xí)現(xiàn)在在哪里應(yīng)用?
維基文章概述了應(yīng)用機器學(xué)習(xí)的所有領(lǐng)域宋彼。這些包括:
計算機視覺:適用于車牌識別和面部識別等應(yīng)用输涕。
信息檢索:適用于搜索引擎慨畸,文本搜索和圖像搜索等應(yīng)用程序先口。
營銷:用于自動化的電子郵件營銷,目標(biāo)識別等應(yīng)用
醫(yī)療診斷:用于癌癥鑒定厢汹,異常檢測等應(yīng)用
自然語言處理:用于情感分析烫葬,照片標(biāo)記等應(yīng)用
在線廣告等
3.機器學(xué)習(xí)和深度學(xué)習(xí)現(xiàn)在在哪里應(yīng)用凡蜻?
維基文章概述了應(yīng)用機器學(xué)習(xí)的所有領(lǐng)域划栓。這些包括:
計算機視覺:適用于車牌識別和面部識別等應(yīng)用。
信息檢索:適用于搜索引擎蒋歌,文本搜索和圖像搜索等應(yīng)用程序堂油。
營銷:用于自動化的電子郵件營銷碧绞,目標(biāo)識別等應(yīng)用
醫(yī)療診斷:用于癌癥鑒定讥邻,異常檢測等應(yīng)用
自然語言處理:用于情感分析,照片標(biāo)記等應(yīng)用
在線廣告等
機器學(xué)習(xí)應(yīng)用
上面給出的圖像恰當(dāng)?shù)乜偨Y(jié)了機器學(xué)習(xí)的應(yīng)用領(lǐng)域撕予。雖然它涵蓋了更廣泛的機器智能主題实抡。
使用機器學(xué)習(xí)/深度學(xué)習(xí)的公司的一個主要例子是Google欢策。
谷歌
在上圖中踩寇,您可以看到Google如何在其各種產(chǎn)品中應(yīng)用機器學(xué)習(xí)俺孙。機器學(xué)習(xí)/深度學(xué)習(xí)的應(yīng)用是無止境的,你只需要看到合適的機會荣茫!
4.未來趨勢
上面的文章講述了機器學(xué)習(xí)和深度學(xué)習(xí)以及它們之間的區(qū)別啡莉。在這部分中旨剥,我將分享一下我認(rèn)為的機器學(xué)習(xí)和深度學(xué)習(xí)未來發(fā)展的觀點轨帜。
首先阵谚,看到在行業(yè)中使用數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的日益增長的趨勢,對于每個想要活下來的公司來說,在他們的業(yè)務(wù)中使用機器學(xué)習(xí)將變得越來越重要嗡午。此外荔睹,每個人都應(yīng)該了解這些基本術(shù)語。
深度學(xué)習(xí)每天都在給我們帶來驚喜宵距,在未來也還會繼續(xù)满哪。這是因為深度學(xué)習(xí)被證明是最先進的技術(shù)之一劝篷。
機器學(xué)習(xí)和深度學(xué)習(xí)的研究是不斷的娇妓。但不同的是往年研究僅限于學(xué)術(shù)界哈恰,現(xiàn)在機器學(xué)習(xí)和深度學(xué)習(xí)的研究在工業(yè)界和學(xué)術(shù)界都在爆炸式增長。隨著可用資金的增加仅乓,它更有可能成為整體人類發(fā)展的一個主題夸楣。
本篇文章翻譯自:Deep Learning vs. Machine Learning – the essential differences you need to know!
作者:是機器學(xué)習(xí)呀盤它
鏈接:http://www.reibang.com/p/48a505212687
來源:簡書
著作權(quán)歸作者所有子漩。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán)幢泼,非商業(yè)轉(zhuǎn)載請注明出處缕棵。