深度學(xué)習(xí)與機(jī)器學(xué)習(xí) - 您需要了解的基本差異蘑拯!
介紹
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)現(xiàn)在風(fēng)靡一時(shí)薪伏!好像就是發(fā)生在一瞬間猾瘸,每個(gè)人都在談?wù)撝鼈?- 無(wú)論人們是否理解兩者中間的差異勉盅!現(xiàn)在人們無(wú)論是否關(guān)注數(shù)據(jù)科學(xué) - 都會(huì)聽到過(guò)這兩個(gè)術(shù)語(yǔ)铆农。
現(xiàn)在展示一下深度學(xué)習(xí)和機(jī)器學(xué)習(xí)所獲得的關(guān)注度牺氨,以下是這些關(guān)鍵字的Google趨勢(shì):
如果你想了解機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間的區(qū)別,請(qǐng)繼續(xù)閱讀這篇以簡(jiǎn)單的外行語(yǔ)言進(jìn)行詳細(xì)比較機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的文章墩剖。我將會(huì)詳細(xì)的解釋這些術(shù)語(yǔ)猴凹。然后比較它們并解釋我們可以在什么地方會(huì)用到它們。
如果你想了解機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間的區(qū)別岭皂,請(qǐng)繼續(xù)閱讀這篇以簡(jiǎn)單的外行語(yǔ)言進(jìn)行詳細(xì)比較機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的文章郊霎。我將會(huì)詳細(xì)的解釋這些術(shù)語(yǔ)。然后比較它們并解釋我們可以在什么地方會(huì)用到它們爷绘。
1.什么是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)
讓我們從基礎(chǔ)的知識(shí)開始開始說(shuō)起 - 什么是機(jī)器學(xué)習(xí)和什么是深度學(xué)習(xí)书劝。如果你已經(jīng)知道這一點(diǎn),那可以跳過(guò)這一部分揉阎,直接去看第二部分庄撮,兩種學(xué)習(xí)之間的比較。
1.1什么是機(jī)器學(xué)習(xí)毙籽?
Tom Mitchell廣泛引用的機(jī)器學(xué)習(xí)定義就很好的解釋了機(jī)器學(xué)習(xí)洞斯。這就是它所說(shuō)的:
-
“據(jù)說(shuō)計(jì)算機(jī)程序可以從經(jīng)驗(yàn)E中學(xué)習(xí)某些類型的任務(wù)T和用來(lái)測(cè)試的P,它在T中的任務(wù)中的表現(xiàn)(由P測(cè)試)會(huì)隨著經(jīng)驗(yàn)E的提高而提高”
這聽起來(lái)很令人費(fèi)解或令人困惑對(duì)吧?那讓我們用簡(jiǎn)單的例子來(lái)分析一下烙如。
案例1 - 機(jī)器學(xué)習(xí) - 根據(jù)高度預(yù)測(cè)權(quán)重
假設(shè)現(xiàn)在需要?jiǎng)?chuàng)建一個(gè)系統(tǒng)么抗,該系統(tǒng)根據(jù)人的身高來(lái)顯示預(yù)測(cè)的體重⊙翘可能有幾個(gè)原因會(huì)讓人對(duì)這個(gè)系統(tǒng)感興趣蝇刀。因?yàn)槲覀兛梢允褂盟鼇?lái)過(guò)濾掉任何可能的欺詐或者獲取數(shù)據(jù)的錯(cuò)誤。首先要做的第一件事就是收集數(shù)據(jù)徘溢。假設(shè)我們現(xiàn)在的數(shù)據(jù)是這樣子的:
圖表上的每個(gè)點(diǎn)代表一個(gè)數(shù)據(jù)點(diǎn)吞琐。首先,我們可以畫一條簡(jiǎn)單的線來(lái)預(yù)測(cè)基于身高的體重然爆。舉一個(gè)簡(jiǎn)單的例子:
-
體重(kg)=身高(cm) - 100
這樣可以幫助我們做出預(yù)測(cè)站粟。雖然這條預(yù)測(cè)線做得不錯(cuò),但我們需要了解它的表現(xiàn)曾雕。在這種情況下奴烙,我們可以說(shuō)我們希望減少預(yù)測(cè)值和實(shí)際值之間的差異。這就是衡量績(jī)效的方法剖张。
此外切诀,我們收集的數(shù)據(jù)點(diǎn)越多(經(jīng)驗(yàn)),我們的模型就越好搔弄。我們還可以通過(guò)添加更多變量(例如性別)并為它們創(chuàng)建不同的預(yù)測(cè)線來(lái)改進(jìn)我們的模型幅虑。
案例2 - 風(fēng)暴預(yù)測(cè)系統(tǒng)
讓我們舉一個(gè)稍微復(fù)雜一點(diǎn)的例子。假設(shè)現(xiàn)在需要構(gòu)建一個(gè)風(fēng)暴預(yù)測(cè)系統(tǒng)顾犹。通過(guò)過(guò)去發(fā)生的所有風(fēng)暴的數(shù)據(jù)翘单,以及這些風(fēng)暴發(fā)生前三個(gè)月的天氣狀況。
考慮到這些蹦渣,如果我們要手動(dòng)建立一個(gè)風(fēng)暴預(yù)測(cè)系統(tǒng)哄芜,我們需要做什么?
我們首先必須檢查所有的數(shù)據(jù),并找到這些數(shù)據(jù)中的模式柬唯。我們的任務(wù)是尋找導(dǎo)致風(fēng)暴的條件认臊。
我們可以模擬這樣的條件,如果溫度大于40攝氏度锄奢,濕度在80到100之間等等失晴。然后手動(dòng)將這些'條件'輸入到我們的系統(tǒng)。
或者拘央,我們可以讓我們的系統(tǒng)在數(shù)據(jù)中了解到這些特征的適當(dāng)值涂屁。
現(xiàn)在要找到這些值,需要瀏覽所有之前的數(shù)據(jù)灰伟,并嘗試預(yù)測(cè)是否會(huì)有風(fēng)暴拆又。根據(jù)系統(tǒng)設(shè)置的特征值儒旬,我們?cè)u(píng)估系統(tǒng)的性能,就是系統(tǒng)正確預(yù)測(cè)風(fēng)暴發(fā)生的次數(shù)帖族。我們可以對(duì)上述步驟進(jìn)一步多次迭代栈源,將性能作為反饋給我們的系統(tǒng)。
讓我們采用我們的正式定義來(lái)嘗試定義我們的風(fēng)暴預(yù)測(cè)系統(tǒng):我們的任務(wù)“T”是找出引發(fā)風(fēng)暴的大氣條件竖般。性能“P”是在提供給系統(tǒng)的所有條件中甚垦,正確預(yù)測(cè)風(fēng)暴的次數(shù)。經(jīng)驗(yàn)'E'是我們系統(tǒng)的重復(fù)模擬涣雕。
1.2什么是深度學(xué)習(xí)艰亮?
深度學(xué)習(xí)的概念并不新鮮。它已經(jīng)存在好幾年了挣郭。但是現(xiàn)在隨著不斷的炒作垃杖,深度學(xué)習(xí)越來(lái)越受到關(guān)注。正如我們?cè)跈C(jī)器學(xué)習(xí)中所做的那樣丈屹,我們先研究深度學(xué)習(xí)的正式定義,然后通過(guò)例子對(duì)深度學(xué)習(xí)分解認(rèn)識(shí)伶棒。
- “深度學(xué)習(xí)是一種特殊的機(jī)器學(xué)習(xí)旺垒,它通過(guò)學(xué)習(xí)將世界表示為嵌套的概念層次結(jié)構(gòu)來(lái)實(shí)現(xiàn)強(qiáng)大的功能和靈活性,每個(gè)概念都是根據(jù)更簡(jiǎn)單的概念進(jìn)行定義的肤无,而更抽象的表示則用不那么抽象的概念計(jì)算出來(lái)先蒋。 ”
這些概念同樣會(huì)讓人困惑不已。現(xiàn)在讓我們用簡(jiǎn)單的例子來(lái)認(rèn)識(shí)它宛渐。
案例1 - 形狀檢測(cè)
讓我從一個(gè)簡(jiǎn)單的例子開始竞漾,它解釋了在概念層面上事情是如何發(fā)生的。讓我們?cè)囍斫馊绾巫R(shí)別其他形狀的正方形窥翩。
我們眼睛做的第一件事就是檢查是否有4條線與一個(gè)圖形相關(guān)聯(lián)的簡(jiǎn)單概念业岁。如果我們找到4條線,我們進(jìn)一步檢查它們是否連接寇蚊,閉合笔时,垂直以及它們是否相等(概念的嵌套層次結(jié)構(gòu))。
因此仗岸,我們采取了一項(xiàng)復(fù)雜的任務(wù)(確定一個(gè)正方形)并將其分解為簡(jiǎn)單的允耿、不那么抽象的東西。深度學(xué)習(xí)在很大程度上就是這么做的
案例2 - 貓還是狗
讓我們舉一個(gè)動(dòng)物識(shí)別器的例子扒怖,我們的系統(tǒng)必須識(shí)別給的圖片是貓還是狗较锡。
如果我們將此作為一個(gè)典型的機(jī)器學(xué)習(xí)問(wèn)題的話,我們必須定義一些特征盗痒,諸如動(dòng)物是否有胡須蚂蕴,是否有耳朵如果有耳朵,那么耳朵是尖的還是稍微圓一點(diǎn)的。簡(jiǎn)單點(diǎn)說(shuō)掂墓,我們要定義面部特征谦纱,讓系統(tǒng)識(shí)別哪些特征在對(duì)特定動(dòng)物進(jìn)行分類時(shí)比較重要。
現(xiàn)在君编,深度學(xué)習(xí)就比機(jī)器學(xué)習(xí)領(lǐng)先一步跨嘉。深度學(xué)習(xí)會(huì)自動(dòng)找出對(duì)分類很重要的特征,在機(jī)器學(xué)習(xí)中我們必須手動(dòng)提供這些特征吃嘿。深度學(xué)習(xí)的工作原理如下:
它首先確定那些特征與分辨出是貓還是狗最有相關(guān)性
然后眉菱,它以層次結(jié)構(gòu)為基礎(chǔ),找到可以找到的特征的組合炊甲。例如琴锭,是否存在胡須,或是否存在耳朵等降瞳。
在對(duì)復(fù)雜概念進(jìn)行連續(xù)層次識(shí)別之后嘱支,它決定通過(guò)哪個(gè)特征負(fù)責(zé)來(lái)找到答案。
2.機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的比較
既然現(xiàn)在你已經(jīng)了解了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的基本概念挣饥,那我們接下來(lái)要用一些重要的觀點(diǎn)來(lái)比較一下這兩種技術(shù)除师。
2.1數(shù)據(jù)依賴
深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)之間最重要的區(qū)別會(huì)隨著數(shù)據(jù)規(guī)模的增大而表現(xiàn)出來(lái)。當(dāng)數(shù)據(jù)很小時(shí)扔枫,深度學(xué)習(xí)算法表現(xiàn)不佳汛聚。這是因?yàn)樯疃葘W(xué)習(xí)算法需要大量數(shù)據(jù)才能完美理解它。另一方面短荐,傳統(tǒng)的機(jī)器學(xué)習(xí)算法及其手工制作的規(guī)則在這種情況下占據(jù)優(yōu)勢(shì)倚舀。下圖總結(jié)了這一事實(shí)。
2.2硬件依賴性
深度學(xué)習(xí)算法在很大程度上依賴于高端機(jī)器忍宋,這與傳統(tǒng)的機(jī)器學(xué)習(xí)算法相反痕貌,后者可以在低端機(jī)器上運(yùn)行。這是因?yàn)樯疃葘W(xué)習(xí)算法的要求包括GPU糠排,因?yàn)镚PU是其工作中不可或缺的組成部分芯侥。深度學(xué)習(xí)算法本質(zhì)上是做大量的矩陣乘法運(yùn)算,而使用GPU可以有效的優(yōu)化這些操作乳讥,而這就是使用GPU的目的柱查。
2.3特征工程
特征工程是將領(lǐng)域知識(shí)放入特征提取器的創(chuàng)建過(guò)程,用來(lái)降低數(shù)據(jù)的復(fù)雜性并使特征對(duì)于學(xué)習(xí)算法更加可見云石。就時(shí)間和專業(yè)知識(shí)而言唉工,這個(gè)過(guò)程是困難而又昂貴的。
在機(jī)器學(xué)習(xí)中汹忠,大多數(shù)應(yīng)用的特征需要由專家識(shí)別淋硝,然后根據(jù)領(lǐng)域和數(shù)據(jù)類型進(jìn)行手動(dòng)編碼雹熬。
例如,特征可以是像素值谣膳,形狀竿报,紋理,位置和方向继谚。大多數(shù)機(jī)器學(xué)習(xí)算法的性能取決于特征識(shí)別和特征提取的準(zhǔn)確程度烈菌。
深度學(xué)習(xí)算法嘗試從數(shù)據(jù)中學(xué)習(xí)高級(jí)特征。這是深度學(xué)習(xí)一個(gè)非常獨(dú)特的部分花履,也是超越傳統(tǒng)機(jī)器學(xué)習(xí)的重要部分芽世。因此,深度學(xué)習(xí)減少了為每個(gè)問(wèn)題開發(fā)新的特征提取器的任務(wù)诡壁。就像济瓢,卷積神經(jīng)網(wǎng)絡(luò)將嘗試先學(xué)習(xí)底層特征,例如早期圖層中的邊緣和線條妹卿,然后是人臉的部分面部旺矾,最后是高級(jí)的面部識(shí)別。
2.4問(wèn)題解決方法
當(dāng)使用傳統(tǒng)的機(jī)器學(xué)習(xí)算法解決問(wèn)題時(shí)夺克,通常建議將問(wèn)題分解為不同的部分箕宙,分別解開這些問(wèn)題,然后將它們組合起來(lái)得到結(jié)果懊直。相反,深度學(xué)習(xí)主張從頭到尾的解決問(wèn)題火鼻。
我們舉一個(gè)例子來(lái)理解這一點(diǎn)室囊。
假設(shè)現(xiàn)在有一個(gè)多個(gè)對(duì)象檢測(cè)的任務(wù)。任務(wù)是確定對(duì)象是什么以及它在圖像中的位置魁索。
在典型的機(jī)器學(xué)習(xí)方法中融撞,可以將問(wèn)題分為兩個(gè)步驟:對(duì)象檢測(cè)和對(duì)象識(shí)別。首先粗蔚,您將使用像grabcut這樣的邊界框檢測(cè)算法來(lái)瀏覽圖像并查找所有可能的對(duì)象尝偎。然后,在所有已識(shí)別的對(duì)象中鹏控,您將使用對(duì)象識(shí)別算法(如帶有HOG的SVM)來(lái)識(shí)別相關(guān)對(duì)象致扯。
相反,在深度學(xué)習(xí)方法中当辐,只需要從頭到尾的完成這個(gè)過(guò)程抖僵。例如,在YOLO net(這是一種深度學(xué)習(xí)算法)中缘揪,傳入這張圖像耍群,它將給出對(duì)象存在的位置以及對(duì)象的名稱义桂。
2.5執(zhí)行時(shí)間
通常,深度學(xué)習(xí)算法需要很長(zhǎng)時(shí)間來(lái)訓(xùn)練蹈垢。這是因?yàn)樯疃葘W(xué)習(xí)算法中有很多的參數(shù)慷吊,所以訓(xùn)練它們需要更長(zhǎng)的時(shí)間。最先進(jìn)的深度學(xué)習(xí)算法ResNet需要大約兩周時(shí)間才能完全從0開始的訓(xùn)練曹抬。相比之下溉瓶,機(jī)器學(xué)習(xí)的訓(xùn)練時(shí)間要短得多,從幾秒鐘到幾小時(shí)不等沐祷。
測(cè)試時(shí)間完全顛倒了嚷闭。在測(cè)試時(shí),深度學(xué)習(xí)算法運(yùn)行的時(shí)間要少得多赖临。然而胞锰,如果把它與k近鄰(一種機(jī)器學(xué)習(xí)算法)進(jìn)行比較,則測(cè)試時(shí)間會(huì)隨著數(shù)據(jù)的增加而增加兢榨。雖然這不適用于所有機(jī)器學(xué)習(xí)算法嗅榕,因?yàn)橛行┧惴ǖ臏y(cè)試時(shí)間也會(huì)很短。
2.6可解釋性
最后一點(diǎn)但并非不重要的是吵聪,我們將可解釋性作為比較機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的一個(gè)因素凌那。這個(gè)因素是深度學(xué)習(xí)在用于行業(yè)之前仍被反復(fù)思考的主要原因。
我們來(lái)舉個(gè)例子吧吟逝。假設(shè)我們使用深度學(xué)習(xí)自動(dòng)為論文打評(píng)分帽蝶。它在打分方面的表現(xiàn)的非常出色,接近人類的表現(xiàn)块攒。但有一個(gè)問(wèn)題励稳。它沒(méi)有透露出為什么它給出了這個(gè)分?jǐn)?shù)。事實(shí)上囱井,你可以通過(guò)數(shù)學(xué)方法找出深層神經(jīng)網(wǎng)絡(luò)的哪些節(jié)點(diǎn)被激活驹尼,但我們不知道這些神經(jīng)元是怎么建模的,以及這些神經(jīng)元做了什么庞呕。所以我們無(wú)法解釋結(jié)果新翎。
另一方面,像決策樹這樣的機(jī)器學(xué)習(xí)算法為我們提供了清晰的規(guī)則住练,解釋了為什么要選擇這個(gè)內(nèi)容地啰,因此特別容易理解其背后的原理。因此讲逛,像決策樹和線性/邏輯回歸等算法主要用于行業(yè)中就是因?yàn)槠浣Y(jié)果的可解釋性髓绽。
3.機(jī)器學(xué)習(xí)和深度學(xué)習(xí)現(xiàn)在在哪里應(yīng)用?
維基文章概述了應(yīng)用機(jī)器學(xué)習(xí)的所有領(lǐng)域妆绞。這些包括:
計(jì)算機(jī)視覺(jué):適用于車牌識(shí)別和面部識(shí)別等應(yīng)用顺呕。
信息檢索:適用于搜索引擎枫攀,文本搜索和圖像搜索等應(yīng)用程序。
營(yíng)銷:用于自動(dòng)化的電子郵件營(yíng)銷株茶,目標(biāo)識(shí)別等應(yīng)用
醫(yī)療診斷:用于癌癥鑒定来涨,異常檢測(cè)等應(yīng)用
自然語(yǔ)言處理:用于情感分析,照片標(biāo)記等應(yīng)用
在線廣告等
3.機(jī)器學(xué)習(xí)和深度學(xué)習(xí)現(xiàn)在在哪里應(yīng)用启盛?
維基文章概述了應(yīng)用機(jī)器學(xué)習(xí)的所有領(lǐng)域蹦掐。這些包括:
計(jì)算機(jī)視覺(jué):適用于車牌識(shí)別和面部識(shí)別等應(yīng)用。
信息檢索:適用于搜索引擎僵闯,文本搜索和圖像搜索等應(yīng)用程序卧抗。
營(yíng)銷:用于自動(dòng)化的電子郵件營(yíng)銷,目標(biāo)識(shí)別等應(yīng)用
醫(yī)療診斷:用于癌癥鑒定鳖粟,異常檢測(cè)等應(yīng)用
自然語(yǔ)言處理:用于情感分析社裆,照片標(biāo)記等應(yīng)用
在線廣告等
上面給出的圖像恰當(dāng)?shù)乜偨Y(jié)了機(jī)器學(xué)習(xí)的應(yīng)用領(lǐng)域。雖然它涵蓋了更廣泛的機(jī)器智能主題向图。
使用機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的公司的一個(gè)主要例子是Google泳秀。
在上圖中,您可以看到Google如何在其各種產(chǎn)品中應(yīng)用機(jī)器學(xué)習(xí)榄攀。機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的應(yīng)用是無(wú)止境的嗜傅,你只需要看到合適的機(jī)會(huì)!
4.未來(lái)趨勢(shì)
上面的文章講述了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)以及它們之間的區(qū)別檩赢。在這部分中吕嘀,我將分享一下我認(rèn)為的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)未來(lái)發(fā)展的觀點(diǎn)。
首先贞瞒,看到在行業(yè)中使用數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的日益增長(zhǎng)的趨勢(shì)偶房,對(duì)于每個(gè)想要活下來(lái)的公司來(lái)說(shuō),在他們的業(yè)務(wù)中使用機(jī)器學(xué)習(xí)將變得越來(lái)越重要憔狞。此外蝴悉,每個(gè)人都應(yīng)該了解這些基本術(shù)語(yǔ)彰阴。
深度學(xué)習(xí)每天都在給我們帶來(lái)驚喜瘾敢,在未來(lái)也還會(huì)繼續(xù)。這是因?yàn)樯疃葘W(xué)習(xí)被證明是最先進(jìn)的技術(shù)之一尿这。
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的研究是不斷的簇抵。但不同的是往年研究?jī)H限于學(xué)術(shù)界,現(xiàn)在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的研究在工業(yè)界和學(xué)術(shù)界都在爆炸式增長(zhǎng)射众。隨著可用資金的增加碟摆,它更有可能成為整體人類發(fā)展的一個(gè)主題。
本篇文章翻譯自:Deep Learning vs. Machine Learning – the essential differences you need to know!