深度學習和機器學習有何區(qū)別至扰?

姓名:米芃

學號:16040520018

[嵌牛導讀]機器學習和深度學習變得越來越火鳍徽。突然之間,不管是了解的還是不了解的敢课,所有人都在談論機器學習和深度學習阶祭。無論你是否主動關(guān)注過數(shù)據(jù)科學,你應該已經(jīng)聽說過這兩個名詞了直秆。

[嵌牛鼻子]機器學習? 深度學習

[嵌牛提問]機器學習與深度學習兩者有什么不同的濒募,區(qū)別在哪?倆者應用范圍切厘?

[嵌牛正文]


如果你想讓自己弄清楚機器學習和深度學習的區(qū)別萨咳,請閱讀本篇文章,我將用通俗易懂的語言為你介紹他們之間的差別疫稿。下文詳細解釋了機器學習和深度學習中的術(shù)語培他。并且,我比較了他們兩者的不同遗座,別說明了他們各自的使用場景舀凛。

什么是機器學習和深度學習?

讓我們從基礎知識開始:什么是機器學習?和什么是深度學習途蒋?如果你對此已有所了解猛遍,隨時可以跳過本部分。

什么是機器學習号坡?

一言以蔽之懊烤,由 Tom Mitchell 給出的被廣泛引用的機器學習的定義給出了最佳解釋。下面是其中的內(nèi)容:

“計算機程序可以在給定某種類別的任務 T 和性能度量 P 下學習經(jīng)驗 E 宽堆,如果其在任務 T 中的性能恰好可以用 P 度量腌紧,則隨著經(jīng)驗 E 而提高⌒罅ィ”

是不是讀起來很繞口呢壁肋?讓我們用簡單的例子來分解下這個描述。

示例 1:機器學習和根據(jù)人的身高估算體重

假設你想創(chuàng)建一個能夠根據(jù)人的身高估算體重的系統(tǒng)(也許你出自某些理由對這件事情感興趣)籽慢。那么你可以使用機器學習去找出任何可能的錯誤和數(shù)據(jù)捕獲中的錯誤浸遗,首先你需要收集一些數(shù)據(jù),讓我們來看看你的數(shù)據(jù)是什么樣子的:

圖片發(fā)自簡書App

圖中的每一個點對應一個數(shù)據(jù)箱亿,我們可以畫出一條簡單的斜線來預測基于身高的體重跛锌。

例如這條斜線:

Weight (in kg) = Height (in cm) - 100

...這些斜線能幫助我們作出預測,盡管這些斜線表現(xiàn)得很棒届惋,但是我們需要理解它是怎么表現(xiàn)的察净,我們希望去減少預測和實際之間的誤差驾茴,這也是衡量其性能的方法。

深遠一點地說氢卡,我們收集更多的數(shù)據(jù) (experience),模型就會變得更好晨缴。我們也可以通過添加更多變量(例如性別)和添加不同的預測斜線來完善我們的模型译秦。

示例2:颶風預測系統(tǒng)

我們找一個復雜一點的例子。假如你要構(gòu)建一個颶風預測系統(tǒng)击碗。假設你手里有所有以前發(fā)生過的颶風的數(shù)據(jù)和這次颶風產(chǎn)生前三個月的天氣信息筑悴。

如果要手動構(gòu)建一個颶風預測系統(tǒng),我們應該怎么做稍途?

首先我們的任務是清洗所有的數(shù)據(jù)找到數(shù)據(jù)里面的模式進而查找產(chǎn)生颶風的條件阁吝。

我們既可以將模型條件數(shù)據(jù)(例如氣溫高于40度,濕度在80-100等)輸入到我們的系統(tǒng)里面生成輸出械拍;也可以讓我們的系統(tǒng)自己通過這些條件數(shù)據(jù)產(chǎn)生合適的輸出突勇。

我們可以把所有以前的數(shù)據(jù)輸入到系統(tǒng)里面來預測未來是否會有颶風】缆牵基于我們系統(tǒng)條件的取值甲馋,評估系統(tǒng)的性能(系統(tǒng)正確預測颶風的次數(shù))。我們可以將系統(tǒng)預測結(jié)果作為反饋繼續(xù)多次迭代以上步驟迄损。

讓我們根據(jù)前邊的解釋來定義我們的預測系統(tǒng):我們的任務是確定可能產(chǎn)生颶風的氣象條件定躏。性能P是在系統(tǒng)所有給定的條件下有多少次正確預測颶風。經(jīng)驗E是我們的系統(tǒng)的迭代次數(shù)芹敌。

什么是深度學習?

深度學習的概念并不新穎痊远。它已經(jīng)存在好幾年了。但伴隨著現(xiàn)有的所有的炒作氏捞,深度的學習越來越受到重視碧聪。正如我們在機器學習中所做的那樣,先來看看深度學習的官方定義幌衣,然后用一個例子來解釋矾削。

“深度學習是一種特殊的機器學習,通過學習將世界使用嵌套的概念層次來表示并實現(xiàn)巨大的功能和靈活性豁护,其中每個概念都定義為與簡單概念相關(guān)聯(lián)哼凯,而更為抽象的表示則以較不抽象的方式來計算〕铮”

這也有點讓人混亂断部。下面使用一個簡單示例來分解下此概念。

示例1: 形狀檢測

先從一個簡單的例子開始班缎,從概念層面上解釋究竟發(fā)生了什么的事情蝴光。我們來試試看如何從其他形狀中識別的正方形她渴。

我們眼中的第一件事是檢查圖中是否有四條的線(簡單的概念)。如果我們找到這樣的四條線蔑祟,我們進一步檢查它們是相連的趁耗、閉合的和相互垂直的,并且它們是否是相等的(嵌套的概念層次結(jié)構(gòu))疆虚。

所以苛败,我們完成了一個復雜的任務(識別一個正方形),并以簡單径簿、不太抽象的任務來完成它罢屈。深度學習本質(zhì)上在大規(guī)模執(zhí)行類似邏輯。

示例2: 貓 vs. 狗

我們舉一個動物辨識的例子篇亭,其中我們的系統(tǒng)必須識別給定的圖像中的動物是貓還是狗缠捌。閱讀下此文,以了解深度學習在解決此類問題上如何比機器學習領先一步译蒂。

機器學習和深度學習的對比

現(xiàn)在的你應該已經(jīng)對機器學習和深度學習有所了解曼月,接下來我們將會學習其中一些重點,并比較兩種技術(shù)蹂随。

數(shù)據(jù)依賴性

深度學習與傳統(tǒng)的機器學習最主要的區(qū)別在于隨著數(shù)據(jù)規(guī)模的增加其性能也不斷增長十嘿。當數(shù)據(jù)很少時,深度學習算法的性能并不好岳锁。這是因為深度學習算法需要大量的數(shù)據(jù)來完美地理解它绩衷。另一方面,在這種情況下激率,傳統(tǒng)的機器學習算法使用制定的規(guī)則咳燕,性能會比較好。下圖總結(jié)了這一事實乒躺。

硬件依賴

深度學習算法需要進行大量的矩陣運算招盲,GPU 主要用來高效優(yōu)化矩陣運算,所以 GPU 是深度學習正常工作的必須硬件嘉冒。與傳統(tǒng)機器學習算法相比曹货,深度學習更依賴安裝 GPU 的高端機器。

特征處理

特征處理是將領域知識放入特征提取器里面來減少數(shù)據(jù)的復雜度并生成使學習算法工作的更好的模式的過程讳推。特征處理過程很耗時而且需要專業(yè)知識顶籽。

在機器學習中,大多數(shù)應用的特征都需要專家確定然后編碼為一種數(shù)據(jù)類型银觅。

特征可以使像素值礼饱、形狀、紋理、位置和方向镊绪。大多數(shù)機器學習算法的性能依賴于所提取的特征的準確度匀伏。

深度學習嘗試從數(shù)據(jù)中直接獲取高等級的特征,這是深度學習與傳統(tǒng)機器學習算法的主要的不同蝴韭」坏撸基于此,深度學習削減了對每一個問題設計特征提取器的工作万皿。例如摧找,卷積神經(jīng)網(wǎng)絡嘗試在前邊的層學習低等級的特征(邊界,線條)牢硅,然后學習部分人臉,然后是高級的人臉的描述芝雪。更多信息可以閱讀神經(jīng)網(wǎng)絡機器在深度學習里面的有趣應用减余。

問題解決方式

當應用傳統(tǒng)機器學習算法解決問題的時候,傳統(tǒng)機器學習通常會將問題分解為多個子問題并逐個子問題解決最后結(jié)合所有子問題的結(jié)果獲得最終結(jié)果惩系。相反位岔,深度學習提倡直接的端到端的解決問題。

舉例說明:

假設有一個多物體檢測的任務需要圖像中的物體的類型和各物體在圖像中的位置堡牡。

傳統(tǒng)機器學會將問題分解為兩步:物體檢測和物體識別抒抬。首先,使用一個邊界框檢測算法掃描整張圖片找到可能的是物體的區(qū)域晤柄;然后使用物體識別算法(例如 SVM 結(jié)合 HOG )對上一步檢測出來的物體進行識別擦剑。

相反,深度學習會直接將輸入數(shù)據(jù)進行運算得到輸出結(jié)果芥颈。例如可以直接將圖片傳給 YOLO 網(wǎng)絡(一種深度學習算法)惠勒,YOLO 網(wǎng)絡會給出圖片中的物體和名稱。

執(zhí)行時間

通常情況下爬坑,訓練一個深度學習算法需要很長的時間纠屋。這是因為深度學習算法中參數(shù)很多,因此訓練算法需要消耗更長的時間盾计。最先進的深度學習算法 ResNet完整地訓練一次需要消耗兩周的時間售担,而機器學習的訓練會消耗的時間相對較少,只需要幾秒鐘到幾小時的時間署辉。

但兩者測試的時間上是完全相反族铆。深度學習算法在測試時只需要很少的時間去運行。如果跟 k-nearest neighbors(一種機器學習算法)相比較涨薪,測試時間會隨著數(shù)據(jù)量的提升而增加骑素。不過這不適用于所有的機器學習算法,因為有些機器學習算法的測試時間也很短。

可解釋性

至關(guān)重要的一點献丑,我們把可解釋性作為比較機器學習和深度學習的一個因素末捣。

我們看個例子。假設我們適用深度學習去自動為文章評分创橄。深度學習可以達到接近人的標準箩做,這是相當驚人的性能表現(xiàn)。但是這仍然有個問題妥畏。深度學習算法不會告訴你為什么它會給出這個分數(shù)邦邦。當然,在數(shù)學的角度上醉蚁,你可以找出來哪一個深度神經(jīng)網(wǎng)絡節(jié)點被激活了燃辖。但是我們不知道神經(jīng)元應該是什么模型,我們也不知道這些神經(jīng)單元層要共同做什么网棍。所以無法解釋結(jié)果是如何產(chǎn)生的黔龟。

另一方面,為了解釋為什么算法這樣選擇滥玷,像決策樹(decision trees)這樣機器學習算法給出了明確的規(guī)則氏身,所以解釋決策背后的推理是很容易的。因此惑畴,決策樹和線性/邏輯回歸這樣的算法主要用于工業(yè)上的可解釋性蛋欣。

機器學習和深度學習用于哪些領域?

維基百科上關(guān)于機器學習的文章概述了所有使用機器學習的領域如贷。這些包括:

計算機視覺 用于車牌識別和面部識別等的應用陷虎。

信息檢索 用于諸如搜索引擎的應用 - 包括文本搜索和圖像搜索。

市場營銷 針對自動電子郵件營銷和目標群體識別等的應用倒得。

醫(yī)療診斷 諸如癌癥識別和異常檢測等的應用泻红。

自然語言處理,如情緒分析和照片標記等的應用霞掺。

上圖恰當?shù)乜偨Y(jié)了機器學習的應用領域谊路,涵蓋了整個機器智能的更廣泛的話題。

使用機器學習/深度學習的公司的一個主要例子是Google菩彬。

在上圖中缠劝,你可以看到 Google 正在將機器學習應用于其各種產(chǎn)品。機器學習/深度學習的應用是無盡的 - 你僅需尋找正確的時機骗灶!

突擊測試

為了評估你是否真的了解這個區(qū)別惨恭,我們將進行一次測驗。 你可以在這個帖子中發(fā)布你的答案耙旦。

請務必涉及以下步驟脱羡,以保證是完整的對各個場景進行回答。

你將如何使用機器學習解決以下問題?

你如何使用深度學習解決以下問題锉罐?

結(jié)論:哪種方法是更好的帆竹?

場景1

你必須建立一個用于自動駕駛車輛的軟件組件。你構(gòu)建的系統(tǒng)應該從相機中獲取原始像素數(shù)據(jù)脓规,并預測你應該引導車輪的角度是多少栽连。

場景2

給定一個人的信用和背景信息,你的系統(tǒng)應該評估出此人是否應該有資格獲得貸款侨舆。

場景3

你必須創(chuàng)建一個可以將俄語消息翻譯成印地語消息的系統(tǒng)秒紧,以便俄語代表能夠與當?shù)氐娜罕娡ㄐ拧?/p>

在此找到針對上述問題的各種數(shù)據(jù)科學家的討論記錄和觀點。

未來發(fā)展趨勢

本文概述了機器學習和深度學習及其差異挨下。在本節(jié)中熔恢,我將分享我對機器學習和深度學習未來發(fā)展的觀點。

首先臭笆,隨著業(yè)內(nèi)對數(shù)據(jù)科學和機器學習使用的日益增長的趨勢绩聘,對于每個想要生存下來的公司來說,重視機器學習將變得非常重要耗啦。蘋果正在 iPhone X 中使用機器學習,這標志著這項技術(shù)的發(fā)展方向机杜。

深入學習讓我們每天都感到驚訝帜讲,并將在不久的將來繼續(xù)如此。這是因為深度學習是被證明為最先進的性能最好的技術(shù)之一椒拗。

針對機器學習和深度學習的研究將是持續(xù)的似将。但與前幾年的研究僅限于學術(shù)界不同的是,機器學習和深度學習方面的研究將在業(yè)界和學術(shù)界都有爆發(fā)式的發(fā)展蚀苛。而且擁有比以往更多的資助在验,更有可能成為人類整體發(fā)展的主旋律。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末堵未,一起剝皮案震驚了整個濱河市腋舌,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌渗蟹,老刑警劉巖块饺,帶你破解...
    沈念sama閱讀 217,657評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異雌芽,居然都是意外死亡授艰,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評論 3 394
  • 文/潘曉璐 我一進店門世落,熙熙樓的掌柜王于貴愁眉苦臉地迎上來淮腾,“玉大人,你說我怎么就攤上這事」瘸” “怎么了洲押?”我有些...
    開封第一講書人閱讀 164,057評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長徘禁。 經(jīng)常有香客問我诅诱,道長,這世上最難降的妖魔是什么送朱? 我笑而不...
    開封第一講書人閱讀 58,509評論 1 293
  • 正文 為了忘掉前任娘荡,我火速辦了婚禮,結(jié)果婚禮上驶沼,老公的妹妹穿的比我還像新娘炮沐。我一直安慰自己,他們只是感情好回怜,可當我...
    茶點故事閱讀 67,562評論 6 392
  • 文/花漫 我一把揭開白布大年。 她就那樣靜靜地躺著,像睡著了一般玉雾。 火紅的嫁衣襯著肌膚如雪翔试。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,443評論 1 302
  • 那天复旬,我揣著相機與錄音垦缅,去河邊找鬼。 笑死驹碍,一個胖子當著我的面吹牛壁涎,可吹牛的內(nèi)容都是我干的及汉。 我是一名探鬼主播逻杖,決...
    沈念sama閱讀 40,251評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼驼抹!你這毒婦竟也來了浮还?” 一聲冷哼從身側(cè)響起竟坛,我...
    開封第一講書人閱讀 39,129評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎碑定,沒想到半個月后流码,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,561評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡延刘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,779評論 3 335
  • 正文 我和宋清朗相戀三年漫试,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片碘赖。...
    茶點故事閱讀 39,902評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡驾荣,死狀恐怖外构,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情播掷,我是刑警寧澤审编,帶...
    沈念sama閱讀 35,621評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站歧匈,受9級特大地震影響垒酬,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜件炉,卻給世界環(huán)境...
    茶點故事閱讀 41,220評論 3 328
  • 文/蒙蒙 一勘究、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧斟冕,春花似錦口糕、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至秀撇,卻和暖如春超棺,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背呵燕。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評論 1 269
  • 我被黑心中介騙來泰國打工说搅, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人虏等。 一個月前我還...
    沈念sama閱讀 48,025評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像适肠,于是被迫代替她去往敵國和親霍衫。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,843評論 2 354

推薦閱讀更多精彩內(nèi)容