摘要: 當你和女朋友在路邊手拉手一起約會的時候,你可曾想洁奈,你們之間早已碰撞出了一種神秘的智慧–深度學習。戀愛容易绞灼,相處不易利术,不斷磨合,打造你們的默契低矮,最終才能決定你們是否在一起印叁。深度學習也一樣,輸入各種不同的參數(shù)军掂,進行訓練擬合轮蜕,最后輸出擬合結(jié)果。 戀愛又不易蝗锥,且學且珍惜跃洛!
導言: 目前人工智能非常火爆终议,而深度學習則是引領(lǐng)這一火爆現(xiàn)場的“火箭”汇竭。于是,有關(guān)“深度學習”的論文穴张、書籍和網(wǎng)絡博客汗牛充棟细燎,但大多數(shù)這類文章都具備“高不成低不就”的特征。對于高手來說皂甘,自然是沒有問題玻驻,他們本身已經(jīng)具備非常“深度”的學習能力偿枕,如果他們想學習有關(guān)深度學習的技術(shù)璧瞬,直接找來最新的研究論文閱讀就好了户辫。但是,對于低手(初學者)而言嗤锉,就沒有那么容易了渔欢,因為他們基礎相對薄弱,通车刀看不太懂膘茎。
于是桃纯,我們推出深度學習的入門系列酷誓。在這個系列文章中,我們力圖用最為通俗易懂态坦、圖文并茂的方式盐数,帶你入門深度學習。我們都知道伞梯,高手從來都是自學出來的玫氢。所以,這個深度學習的入門系列谜诫,能帶給你的是“從入門到精通”漾峡,還是“從入門到放棄”,一切都取決你個人的認知喻旷。成就你自己的生逸,永遠都是你自己,是吧且预?
好了槽袄,言歸正傳,下面開始我們的正題锋谐。
1. 什么是學習遍尺?
說到深度學習,我們首先需要知道涮拗,什么是學習乾戏。
著名學者赫伯特·西蒙教授(Herbert Simon,1975年圖靈獎獲得者三热、1978年諾貝爾經(jīng)濟學獎獲得者)曾對“學習”給了一個定義:“如果一個系統(tǒng)歧蕉,能夠通過執(zhí)行某個過程,就此改進了它的性能康铭,那么這個過程就是學習”惯退。
大牛就是大牛,永遠都是那么言簡意賅从藤,一針見血催跪。從西蒙教授的觀點可以看出锁蠕,學習的核心目的,就是改善性能懊蒸。
其實對于人而言荣倾,這個定義也是適用的。比如骑丸,我們現(xiàn)在正在學習“深度學習”的知識舌仍,其本質(zhì)目的就是為了“提升”自己在機器學習上的認知水平。如果我們僅僅是低層次的重復性學習通危,而沒有達到認知升級的目的铸豁,那么即使表面看起來非常勤奮,其實我們也僅僅是個“偽學習者”, 因為我們沒有改善性能菊碟。
2. 什么是機器學習节芥?
遵循西蒙教授的觀點,對于計算機系統(tǒng)而言逆害,通過運用數(shù)據(jù)及某種特定的方法(比如統(tǒng)計的方法或推理的方法)头镊,來提升機器系統(tǒng)的性能,就是機器學習魄幕。
英雄所見略同相艇。卡內(nèi)基梅隆大學的Tom Mitchell教授纯陨,在他的名作《機器學習》一書中坛芽,也給出了更為具體(其實也很抽象)的定義:
對于某類任務(Task,簡稱T)和某項性能評價準則(Performance队丝,簡稱P)靡馁,如果一個計算機程序在T上,以P作為性能的度量机久,隨著很多經(jīng)驗(Experience臭墨,簡稱E)不斷自我完善,那么我們稱這個計算機程序在從經(jīng)驗E中學習了膘盖。
比如說胧弛,對于學習圍棋的程序AlphaGo,它可以通過和自己下棋獲取經(jīng)驗侠畔,那么它的任務T就是“參與圍棋對弈”结缚;它的性能P就是用“贏得比賽的百分比”來度量∪砉祝“類似地红竭,學生的任務T就是“上課看書寫作業(yè)”;它的性能P就是用“期末成績”來度量”
因此,Mitchell教授認為茵宪,對于一個學習問題最冰,我們需要明確三個特征:任務的類型,衡量任務性能提升的標準以及獲取經(jīng)驗的來源稀火。
3. 學習的4個象限
在前面的文章中暖哨,我們已提到,一般說來凰狞,人類的知識在兩個維度上可分成四類篇裁。即從可統(tǒng)計與否上來看,可分為:是可統(tǒng)計的和不可統(tǒng)計的赡若。從能否推理上看达布,可分為可推理的和不可推理的。
在橫向方向上斩熊,對于可推理的往枣,我們都可以通過機器學習的方法伐庭,最終可以完成這個推理粉渠。傳統(tǒng)的機器學習方法,就是試圖找到可舉一反三的方法圾另,向可推理但不可統(tǒng)計的象限進發(fā)(象限Ⅱ)霸株。目前看來,這個象限的研究工作(即基于推理的機器學習)陷入了不溫不火的境地集乔,能不能峰回路轉(zhuǎn)去件,還有待時間的檢驗。
而在縱向上扰路,對于可統(tǒng)計的尤溜、但不可推理的(即象限Ⅲ),可通過神經(jīng)網(wǎng)絡這種特定的機器學習方法汗唱,以期望達到性能提升的目的宫莱。目前,基于深度學習的棋類博弈(阿爾法狗)哩罪、計算機視覺(貓狗識別)授霸、自動駕駛等等,其實都是在這個象限做出了了不起的成就际插。
從圖可知碘耳,深度學習屬于統(tǒng)計學習的范疇。用李航博士的話來說框弛,統(tǒng)計機器學習的對象辛辨,其實就是數(shù)據(jù)。這是因為,對于計算機系統(tǒng)而言斗搞,所有的“經(jīng)驗”都是以數(shù)據(jù)的形式存在的绞蹦。作為學習的對象,數(shù)據(jù)的類型是多樣的榜旦,可以是各種數(shù)字幽七、文字、圖像溅呢、音頻澡屡、視頻,也可以是它們的各種組合咐旧。
統(tǒng)計機器學習驶鹉,就是從數(shù)據(jù)出發(fā),提取數(shù)據(jù)的特征(由誰來提取铣墨,是個大是大非問題室埋,下面將給予介紹),抽象出數(shù)據(jù)的模型伊约,發(fā)現(xiàn)數(shù)據(jù)中的知識姚淆,最后又回到數(shù)據(jù)的分析與預測當中去。
4. 機器學習的方法論
這里稍早說明的一點的是屡律,在深度學習中腌逢,經(jīng)常有“end-to-end(端到端)”學習的提法,與之相對應的傳統(tǒng)機器學習是“Divide and Conquer(分而治之)”超埋。這些都是什么意思呢搏讶?
“end-to-end”(端到端)說的是,輸入的是原始數(shù)據(jù)(始端)霍殴,然后輸出的直接就是最終目標(末端)媒惕,中間過程不可知,因此也難以知来庭。比如說妒蔚,基于深度學習的圖像識別系統(tǒng),輸入端是圖片的像素數(shù)據(jù)巾腕,而輸出端直接就是或貓或狗的判定面睛。這個端到端就是:像素-->判定。
再比如說尊搬,“end-to-end”的自動駕駛系統(tǒng)叁鉴,輸入的是前置攝像頭的視頻信號(其實也就是像素),而輸出的直接就是控制車輛行駛指令(方向盤的旋轉(zhuǎn)角度)佛寿。這個端到端就是:像素-->指令幌墓。
就此但壮,有人批評深度學習就是一個黑箱(Black Box)系統(tǒng),其性能很好常侣,卻不知道為何而好蜡饵,也就是說,缺乏解釋性胳施。其實溯祸,這是由于深度學習所處的知識象限決定的。從圖1可以看出舞肆,深度學習焦辅,在本質(zhì)上,屬于可統(tǒng)計不可推理的范疇椿胯】甑牵“可統(tǒng)計”是很容易理解的,就是說哩盲,對于同類數(shù)據(jù)前方,它具有一定的統(tǒng)計規(guī)律,這是一切統(tǒng)計學習的基本假設廉油。那“不可推理”又是什么概念惠险?其實就是“剪不斷、理還亂”的非線性狀態(tài)了娱两。
在哲學上講莺匠,這種非線性狀態(tài)金吗,是具備了整體性的“復雜系統(tǒng)”十兢,屬于復雜性科學范疇。復雜性科學認為摇庙,構(gòu)成復雜系統(tǒng)的各個要素旱物,自成體系,但阡陌縱橫卫袒,其內(nèi)部結(jié)構(gòu)難以分割宵呛。簡單來說,對于復雜系統(tǒng)夕凝,1+1≠2宝穗,也就是說诽偷,一個簡單系統(tǒng)绳慎,加上另外一個簡單系統(tǒng)戳吝,其效果絕不是兩個系統(tǒng)的簡單累加效應糠爬,而可能是大于部分之和布卡。因此局义,我們必須從整體上認識這樣的復雜系統(tǒng)哀卫。于是澜沟,在認知上,就有了從一個系統(tǒng)或狀態(tài)(end)直接整體變遷到另外一個系統(tǒng)或狀態(tài)(end)的形態(tài)晋控。這就是深度學習背后的方法論汞窗。
與之對應的是“Divide and Conquer(分而治之)”,其理念正好相反赡译,在哲學它屬于“還原主義(reductionism仲吏,或稱還原論)”。在這種方法論中蝌焚,有一種“追本溯源”的蘊意包含其內(nèi)蜘矢,即一個系統(tǒng)(或理論)無論多復雜,都可以分解综看、分解品腹、再分解,直到能夠還原到邏輯原點红碑。
在意象上舞吭,還原主義就是“1+1=2”,也就是說析珊,一個復雜的系統(tǒng)羡鸥,都可以由簡單的系統(tǒng)簡單疊加而成(可以理解為線性系統(tǒng)),如果各個簡單系統(tǒng)的問題解決了忠寻,那么整體的問題也就得以解決惧浴。比如說,很多的經(jīng)典力學問題奕剃,不論形式有多復雜衷旅,通過不斷的分解和還原,最后都可以通過牛頓的三大定律得以解決纵朋。
經(jīng)典機器學習(位于第Ⅱ象限)柿顶,在哲學上,在某種程度上操软,就可歸屬于還原主義嘁锯。傳統(tǒng)的機器學習方式,通常是用人類的先驗知識聂薪,把原始數(shù)據(jù)預處理成各種特征(feature)家乘,然后對特征進行分類。
然而藏澳,這種分類的效果仁锯,高度取決于特征選取的好壞。傳統(tǒng)的機器學習專家們笆载,把大部分時間都花在如何尋找更加合適的特征上扑馁。因此涯呻,早期的機器學習專家們非常苦逼腻要,故此复罐,傳統(tǒng)的機器學習,其實可以有個更合適的稱呼——特征工程(feature engineering)雄家。
但這種苦逼效诅,也是有好處的。這是因為趟济,這些特征是由人找出來的乱投,自然也就為人所能理解,性能好壞顷编,機器學習專家們可以“冷暖自知”戚炫,靈活調(diào)整。
5. 什么是深度學習
再后來媳纬,機器學習的專家們發(fā)現(xiàn)双肤,可以讓神經(jīng)網(wǎng)絡自己學習如何抓取數(shù)據(jù)的特征,這種學習的方式钮惠,效果更佳茅糜。于是興起了特征表示學習(feature representation learning)的風潮。這種學習方式素挽,對數(shù)據(jù)的擬合也更加的靈活好用蔑赘。于是,人們終于從自尋“特征”的苦逼生活中解脫出來预明。
但這種解脫也付出了代價缩赛,那就是機器自己學習出來的特征,它們存在于機器空間贮庞,完全超越了人類理解的范疇峦筒,對人而言,這就是一個黑盒世界窗慎。為了讓神經(jīng)網(wǎng)絡的學習性能,表現(xiàn)得更好一些卤材,人們只能依據(jù)經(jīng)驗遮斥,不斷地嘗試性地進行大量重復的網(wǎng)絡參數(shù)調(diào)整,同樣是“苦不堪言”扇丛。于是术吗,“人工智能”領(lǐng)域就有這樣的調(diào)侃:“有多少人工,就有多少智能”帆精。
因此较屿,你可以看到隧魄,在這個世界上,存在著一個“麻煩守恒定律”:麻煩不會減少隘蝎,只會轉(zhuǎn)移购啄。
再后來,網(wǎng)絡進一步加深嘱么,出現(xiàn)了多層次的“表示學習”狮含,它把學習的性能提升到另一個高度。這種學習的層次多了曼振,其實也就是套路“深了”几迄。于是,人們就給它取了個特別的名稱——Deep Learning(深度學習)冰评。
深度學習的學習對象同樣是數(shù)據(jù)映胁。與傳統(tǒng)機器學習所不同的是,它需要大量的數(shù)據(jù)甲雅,也就是“大數(shù)據(jù)(Big Data)”屿愚。
有一個觀點,在工業(yè)界一度很流行务荆,那就是在大數(shù)據(jù)條件下妆距,簡單的學習模型會比復雜模型更加有效。而簡單的模型函匕,最后會趨向于無模型娱据,也就是無理論。例如盅惜,早在2008年中剩,美國 《連線》(Wired)雜志主編克里斯﹒安德森(Chris Anderson)就曾發(fā)出“理論的終結(jié)(The End of Theory)”的驚人斷言:“海量數(shù)據(jù)已經(jīng)讓科學方法成為過去時(The Data Deluge Makes the Scientific Method Obsolete)”。
但地平線機器人創(chuàng)始人(前百度深度學習研究院副院長)余凱先生認為抒寂,深度學習的驚人進展结啼,是時候促使我們要重新思考這個觀點了。也就是說屈芜,他認為“大數(shù)據(jù)+復雜模型”或許能更好地提升學習系統(tǒng)的性能郊愧。
6. “戀愛”中的深度學習
法國科技哲學家伯納德﹒斯蒂格勒(Bernard Stiegler)認為,人們以自己的技術(shù)和各種物化的工具井佑,作為自己“額外”的器官属铁,不斷的成就自己。按照這個觀點躬翁,其實焦蘑,在很多場景下,計算機都是人類思維的一種物化形式盒发。換句話說例嘱,計算機的思維(比如說各種電子算法)狡逢,都能找到人類生活實踐的影子。
比如說拼卵,現(xiàn)在火熱的深度學習奢浑,與人們的戀愛過程也有相通之處。在知乎上间学,就有人(jacky yang)以戀愛為例來說明深度學習的思想殷费,倒也非常傳神。我們知道低葫,男女戀愛大致可分為三個階段:
第一階段初戀期详羡,相當于深度學習的輸入層。妹子吸引你嘿悬,肯定是有很多因素实柠,比如說臉蛋、身高善涨、身材窒盐、性格、學歷等等钢拧,這些都是輸入層的參數(shù)蟹漓。對不同喜好的人,他們對輸出結(jié)果的期望是不同的源内,自然他們對這些參數(shù)設置的權(quán)重也是不一樣的葡粒。比如,有些人是奔著結(jié)婚去的膜钓,那么他們對妹子的性格可能給予更高的權(quán)重嗽交。否則,臉蛋的權(quán)重可能會更高颂斜。
第二階段熱戀期夫壁,對應于深度學習的隱藏層。在這個期間沃疮,戀愛雙方都要經(jīng)歷各種歷練和磨合盒让。清朝湖南湘潭人張燦寫了一首七絕:
書畫琴棋詩酒花,當年件件不離他忿磅。
而今七事都更變糯彬,柴米油鹽醬醋茶。
這首詩說的就是葱她,在過日子的洗禮中,各種生活瑣事的變遷似扔。戀愛是過日子的一部分吨些,其實也是如此搓谆,也需要雙方不斷磨合。這種磨合中的權(quán)重取舍平衡豪墅,就相等于深度學習中隱藏層的參數(shù)調(diào)整泉手,它們需要不斷地訓練和修正!戀愛雙方相處偶器,磨合是非常重要的斩萌。要怎么磨合呢?光說“520(我愛你)”屏轰,是廉價的颊郎。這就給我們程序猿(媛)提個醒,愛她(他)霎苗,就要多陪陪她(他)姆吭。陪陪她(他),就增加了參數(shù)調(diào)整的機會唁盏。參數(shù)調(diào)整得好内狸,輸出的結(jié)果才能是你想要的。
第三階段穩(wěn)定期厘擂,自然相當于深度學習的輸出層昆淡。輸出結(jié)果是否合適,是否達到預期刽严,高度取決于“隱藏層”的參數(shù) “磨合”得怎么樣昂灵。
7. 小結(jié)
在本小節(jié),我們回顧了“機器學習”的核心要素港庄,那就是通過對數(shù)據(jù)運用倔既,依據(jù)統(tǒng)計或推理的方法,讓計算機系統(tǒng)的性能得到提升鹏氧。而深度學習渤涌,則是把由人工選取對象特征,變更為通過神經(jīng)網(wǎng)絡自己選取特征把还,為了提升學習的性能实蓬,神經(jīng)網(wǎng)絡的表示學習的層次較多(較深)。
以上僅僅給出機器學習和深度學習的概念性描述吊履,在下一個小結(jié)中安皱,我們將給出機器學習的形式化表示,傳統(tǒng)機器學習和深度學習的不同之處在哪里艇炎,以及到底什么是神經(jīng)網(wǎng)絡等酌伊。
8. 請你思考
- 在大數(shù)據(jù)時代,你是贊同科技編輯出生的克里斯﹒安德森的觀點呢(僅需簡單模型甚至無模型)缀踪,還是更認可工業(yè)界大神余凱先生的觀點呢(還是需要復雜模型)居砖?為什么虹脯?
- 你認為用“戀愛”的例子比擬“深度學習”貼切嗎?為什么奏候?
- 為什么非要用“深度”學習循集,“淺度”不行嗎?