人工智能這門學(xué)科只祠,別說我們一般人了,就是很多業(yè)內(nèi)人士也很難搞得特別清楚扰肌。究其原因抛寝,人工智能是一個非常廣泛的領(lǐng)域,涵蓋了很多大的學(xué)科曙旭。大致可以歸納為以下六個類別:
在進一步闡述深度學(xué)習(xí)之前盗舰,我們需要了解什么是機器學(xué)習(xí)(Machine Learning)。機器學(xué)習(xí)是人工智能的一個分支桂躏,而在很多時候钻趋,幾乎成為人工智能的代名詞。簡單來說剂习,機器學(xué)習(xí)就是通過算法蛮位,使得機器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本做智能識別或?qū)ξ磥碜鲱A(yù)測鳞绕。
深度學(xué)習(xí)是機器學(xué)習(xí)研究中的一個新的領(lǐng)域失仁,其目的是建立可以模擬人腦進行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。簡單來說们何,深度學(xué)習(xí)就是使用深度神經(jīng)網(wǎng)絡(luò)來做機器學(xué)習(xí)萄焦。
仍然是一頭霧水?沒關(guān)系冤竹,小T舉一個生活中常見的挑水果的示例大家就很容易明白了拂封。
小時候,媽媽讓我們幫忙出門去買些水果鹦蠕。因為家人都喜歡甜美多汁的蘋果冒签,所以媽媽告訴我們:果皮透亮的紅色蘋果比綠色的蘋果要更甜一些。由此我們產(chǎn)生了一個簡單的規(guī)則:只挑選皮亮色紅的蘋果钟病。
蘋果買回來吃了以后我們發(fā)現(xiàn)镣衡,同樣是皮亮色紅的蘋果,其中有一些其實味道也并不好档悠。很顯然廊鸥,媽媽教給我們的方法有些片面了,挑選甜美多汁的蘋果的標(biāo)準(zhǔn)并不只根據(jù)顏色辖所。
通過不斷購買和嘗試大量蘋果以后惰说,我們總結(jié)出來一個結(jié)論:皮亮色紅是沒有錯的,但是相對于那種有著大片紅色果皮的蘋果來講缘回,紅色呈條紋狀的那種更甜更好吃吆视。從此以后典挑,我們就會加上這條新的經(jīng)驗結(jié)論去購買蘋果。
過了一段時間有一天您觉,我們發(fā)現(xiàn)經(jīng)常購買蘋果的那家店鋪關(guān)門了。所以我們又換了另外一家水果店根據(jù)以前經(jīng)驗結(jié)論去購買蘋果授滓。不過這家店鋪的蘋果和之前我們常去的那家的蘋果不是一個產(chǎn)地的琳水,之前的一些經(jīng)驗結(jié)論又不適用了。于是我們又重新開始嘗試般堆,發(fā)現(xiàn)A產(chǎn)地的蘋果是紅色條紋的最甜在孝,而B產(chǎn)地的蘋果是黃紅色的最甜。
又過了一段時間家里來了個妹妹淮摔,妹妹并不喜歡甜甜的紅蘋果私沮,只喜歡酸酸甜甜的橙子。和橙。仔燕。(額,腦仁疼Dд小).我們之前所有實踐得出的蘋果知識都沒用了涨享。我們需要根據(jù)之前挑蘋果的經(jīng)驗,用相同的辦法重新研究一遍哪些橙子的口感最好仆百。
在這個買水果的例子中俄周,我們就相當(dāng)與一個進行深度學(xué)習(xí)的機器。大量的試吃的蘋果就是機器的訓(xùn)練數(shù)據(jù)建丧。我們通過對大量數(shù)據(jù)的分類和邏輯判斷,不斷更新和修正自身在購買水果這個方向的認(rèn)知波势。
這其中的分類和邏輯判斷翎朱,就是機器的算法尺铣。讀取更多的訓(xùn)練數(shù)據(jù)拴曲,機器的準(zhǔn)確率也會更高凛忿,一旦發(fā)生預(yù)測錯誤機器就會進行自我修正澈灼。
更妙的是,機器還能用同一個算法來訓(xùn)練不同的模型,預(yù)測不同的水果:橙子叁熔、香蕉、葡萄荣回、櫻桃、西瓜之類的等等壕吹。
由此可見糯累,深度學(xué)習(xí)的進展本質(zhì)上是由大數(shù)據(jù)喂養(yǎng)出來的册踩。大數(shù)據(jù)時代泳姐,海量高質(zhì)量的帶標(biāo)注數(shù)據(jù)暂吉,使深度學(xué)習(xí)模型可以學(xué)習(xí)到非常有效的層次化特征表示慕的;以云計算為代表的大規(guī)模分布式計算平臺以及GPU、FPGA等硬件能力的提升為深度學(xué)習(xí)提供了必要的計算基礎(chǔ)設(shè)施肮街。大數(shù)據(jù)喂養(yǎng)下的深度學(xué)習(xí)取得了顯著進展,機器在圖像沛硅、語音識別等感知能力方面甚至超越人類绕辖。在深度學(xué)習(xí)的推動下茁瘦,自然語言處理方面也取得了顯著進展。
1蛤签、依賴大規(guī)模標(biāo)注數(shù)據(jù)和難以有效利用先驗知識等局限性记罚,阻礙了深度學(xué)習(xí)的進一步發(fā)展次泽。
由于深度學(xué)習(xí)需要的訓(xùn)練數(shù)據(jù)數(shù)量十分龐大,而隨著數(shù)據(jù)采集難度和獲取成本的日益增高疹娶,深度學(xué)習(xí)也逐漸體現(xiàn)出其局限性伦连。
2钳垮、深度學(xué)習(xí)還有一個不小的問題:沒有人知道它是如何運作的额港。
深度神經(jīng)網(wǎng)絡(luò)的架構(gòu)由于或多或少受到了人類大腦的啟發(fā)移斩,正如人類的大腦一樣,深度學(xué)習(xí)的程序很難從外部理解:它是一個神秘的黑箱向瓷。也就是說,我們?yōu)闄C器提供大量的訓(xùn)練數(shù)據(jù)你稚,機器就能夠產(chǎn)生一套算法并不斷自行進化和修正朱躺。但是這套算法機器是如何產(chǎn)生的,我們不得而知长搀。
目前源请,全世界的科學(xué)家們都在全力開發(fā)工具打開這個黑箱。因為黑箱的存在即意味著不可解釋谁尸,以及不確定性×螂“我們并不確定神經(jīng)網(wǎng)絡(luò)在做什么背镇,我們不太信任它∑破牛”工程師們告訴小T:“對神經(jīng)網(wǎng)絡(luò)的恐懼是完全正當(dāng)?shù)男卮眩嬲屛腋械娇謶值氖巧窠?jīng)網(wǎng)絡(luò)在學(xué)習(xí)對的事情的同時也學(xué)習(xí)了錯的事情。”
深度學(xué)習(xí)的大量實踐中抛丽,人們越來越多地發(fā)現(xiàn)深度學(xué)習(xí)模型的結(jié)果往往與人的先驗知識或者專家知識相沖突饰豺。如何讓深度學(xué)習(xí)擺脫對于大規(guī)模樣本的依賴?如何讓深度學(xué)習(xí)模型有效利用大量存在的先驗知識蒿柳?如何讓深度學(xué)習(xí)模型的結(jié)果與先驗知識一致已成為了當(dāng)前深度學(xué)習(xí)領(lǐng)域的重要問題漩蟆。
下期內(nèi)容:什么是數(shù)據(jù)標(biāo)注?|“人工智能+區(qū)塊鏈”科普第5問