李宏毅機器學(xué)習(xí)(十六)Why Deep

為什么Deeper更好糜俗,我們神經(jīng)網(wǎng)絡(luò)層數(shù)多滤港,因為參數(shù)多,當(dāng)然也表現(xiàn)得更好

插圖1

我們比較胖短型和深瘦型添寺,哪個有優(yōu)勢呢胯盯,我們需要在相同的參數(shù)量下進行比較

插圖2

我們比較2種形狀,當(dāng)高瘦型是5*2K個神經(jīng)元時计露,矮胖相同的參數(shù)量要1*3772個神經(jīng)元博脑,其準確率比左側(cè)低憎乙,下一行類似,我們甚至可以把矮胖型的神經(jīng)元增加到1*16K個叉趣,但是準確率還不如2*2K的左側(cè)泞边,所以我們增加參數(shù)時要把參數(shù)盡可能的增加到深度上而不是廣度上。

插圖3

我們可以把深度學(xué)習(xí)類比成模組化過程君账,比如我們建立函數(shù)并不需要重復(fù)寫函數(shù)內(nèi)容繁堡,可以通過層級,讓高層函數(shù)調(diào)用底層函數(shù)結(jié)果

插圖4

假設(shè)我們要分類實現(xiàn)判斷是不是長發(fā)乡数,是否是男女椭蹄,的4種情況分類,我們的長發(fā)男樣本數(shù)量比較小净赴,所以矮胖的第二個判斷長發(fā)男的分類器就比較弱

插圖5

我們就可以先訓(xùn)練比較強的分類器绳矩,長發(fā)和短發(fā)數(shù)據(jù)都比較多,容易分類玖翅,男性和女性的數(shù)據(jù)也比較多翼馆,也可以實現(xiàn)分類

插圖6

于是我們就可以根據(jù)基本分類器的輸出組合實現(xiàn)細分類器,就可以使用較少的數(shù)據(jù)實現(xiàn)分類

插圖7

所以我們就能把神經(jīng)網(wǎng)絡(luò)的每一層想象成一個分類器金度,下一層依據(jù)上一層分類的模組進行進一步細分应媚,具體怎么實現(xiàn)模組化,是程序不斷迭代學(xué)習(xí)到的猜极。課上老師解釋道中姜,往往很多人認為AI就是DeepData,就要大數(shù)據(jù),事實上用DeepLearning卻是在減少使用訓(xùn)練數(shù)據(jù)的跟伏,如果我們有全世界所有樣本的數(shù)據(jù)丢胚,那么我們還做什么深度學(xué)習(xí)呢,正是因為我們手里的數(shù)據(jù)量不夠受扳,所以才進行DeepLearning

插圖8

我們都知道深度學(xué)習(xí)可以做語言識別携龟,具體是怎么做呢,我們先將聲音分成不同的phoneme(音標)勘高,比如u的音在不同位置發(fā)音效果就不一樣峡蟋,我們就用到了tri-phone,將其前后的音聯(lián)合起來

插圖9

我們將一段對話按時間單元拆分成若干組华望,每組根據(jù)不同時間點的頻率形成一組向量蕊蝗,根據(jù)向量我們可以決定他的狀態(tài),根據(jù)狀態(tài)再決定其發(fā)音立美,根據(jù)發(fā)音決定是否有同音異意等等匿又。

插圖10

我們傳統(tǒng)的語音識別時根據(jù)GMM,分辨每段屬于哪個Phoneme建蹄,如果一共30個Phoneme碌更,3個分叉就需要30**3=27000個裕偿,參數(shù)就太多了

插圖11

我們的不同的phoneme可能經(jīng)過相同的屬性處理,但是在經(jīng)典非深度學(xué)習(xí)的過程中是假設(shè)他們是獨立的

插圖12

但實際上痛单,這些發(fā)音往往是有聯(lián)系的嘿棘,以舌頭的不同位置和不同口型,我們把各種母音列出如下關(guān)系旭绒,有舌頭距離嘴的遠近和口型的大小

插圖13

我們用深度學(xué)習(xí)DNN就可以將每一個Phoneme屬于不同state打的幾率算出來鸟妙,而且所有的state只用同一個DNN就能訓(xùn)練出來,不用不同state訓(xùn)練不同的網(wǎng)絡(luò)

插圖14

我們將語音識別的隱層輸出投影到2維上挥吵,就可以大致發(fā)現(xiàn)原因分布的位置大致和舌頭相關(guān)分布位置一致

插圖15

有人說過如果神經(jīng)元足夠多重父,我們使用一層隱層就可以實現(xiàn)任何分類功能,的確似乎是這樣忽匈,但是這種方法是相當(dāng)沒有效率的

插圖16

有EE背景的同學(xué)房午,可以把邏輯電路和神經(jīng)網(wǎng)絡(luò)聯(lián)系起來,我們都知道用2層邏輯層理論上可以實現(xiàn)任何邏輯功能丹允,但是用更多層邏輯門往往能使函數(shù)簡化郭厌,神經(jīng)網(wǎng)絡(luò)也是一樣,相同功能需要更少的神經(jīng)元雕蔽,也可以使用更少的數(shù)據(jù)來完成功能

插圖17

我們以下圖為例折柠,為了識別圖中紅色和藍色區(qū)域,我們使用1個隱層和3個隱層批狐,為了參數(shù)量一致扇售,我們控制了神經(jīng)元個數(shù),當(dāng)我們使用100000個樣本時贾陷,1層隱層的也有一定的效果缘眶,但我們使用20000個數(shù)據(jù)時嘱根,1層的崩壞的就比較嚴重了髓废,而3層的還比右側(cè)有些崩壞,類似于逐級的该抒,總體效果比1層好

插圖18

我們可以用DNN做End-to-end Learning慌洪,就是比較復(fù)雜的學(xué)習(xí)過程,例如語言識別凑保,我們建立模型就相當(dāng)于建立一條生產(chǎn)線冈爹,每層做固定的事情,當(dāng)我們確定好模型欧引,函數(shù)就應(yīng)該自己學(xué)好

插圖19

我們經(jīng)典的語音識別是將聲音-DFT-spectrogram-Filter bank-log-DCT-MFCC-GMM-輸出频伤,而經(jīng)過深度學(xué)習(xí),我們完全可以模擬GMM的功能(GMM是信號處理函數(shù)計算的近乎頂點)芝此,甚至從DCT開始都加入到深度學(xué)習(xí)去實現(xiàn)憋肖,到現(xiàn)在已經(jīng)有從Filter bank來實現(xiàn)因痛,我們發(fā)現(xiàn)定制足夠的深度,計算機自己就能實現(xiàn)每個單元的功能岸更。

圖像識別過去也有比較經(jīng)典的算法鸵膏,得出分類識別結(jié)果,但是現(xiàn)在我們已經(jīng)可以通過深度學(xué)習(xí)實現(xiàn)

插圖20

對于復(fù)雜的任務(wù)怎炊,比如比較像的狗和熊谭企,我們要正確分類,而2個看上去不一樣的都是火車评肆,如果神經(jīng)網(wǎng)絡(luò)層數(shù)不夠债查,可能不會識別出來

插圖21

還是語音識別的例子,我們錄了不同人的不同聲音瓜挽,相同顏色是同一個人說的話攀操,左下即這個輸入,我們投影到2維秸抚,看上去好像很沒有規(guī)律速和,在第一層隱層,我們看上去也沒有得到比較明顯的分別

插圖22

我們再觀察第8層隱層的時候就會發(fā)現(xiàn)剥汤,不同人說的相同的話就會比較重疊的放置在一起了颠放,經(jīng)過了8層打的轉(zhuǎn)換,不同人的相同的話就會被識別出來

插圖23

我們類比手寫數(shù)字吭敢,輸入4,9是比較重疊的碰凶,經(jīng)過幾層的隱層,分開的就越明顯

插圖24

我們可以讀下這個哥們的文章鹿驼,深度學(xué)習(xí)到底需要用深層嗎欲低,文章舉例了他用一層隱層模擬三層的功能,當(dāng)標簽設(shè)置不直接設(shè)置目標標簽時畜晰,可以使訓(xùn)練結(jié)果好砾莱,但是如果用目標標簽訓(xùn)練就是不行,不過他最后的結(jié)果還是需要深層神經(jīng)網(wǎng)絡(luò)= =

插圖25
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末凄鼻,一起剝皮案震驚了整個濱河市腊瑟,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌块蚌,老刑警劉巖闰非,帶你破解...
    沈念sama閱讀 221,576評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異峭范,居然都是意外死亡财松,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評論 3 399
  • 文/潘曉璐 我一進店門纱控,熙熙樓的掌柜王于貴愁眉苦臉地迎上來辆毡,“玉大人政敢,你說我怎么就攤上這事∨咂龋” “怎么了喷户?”我有些...
    開封第一講書人閱讀 168,017評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長访锻。 經(jīng)常有香客問我褪尝,道長,這世上最難降的妖魔是什么期犬? 我笑而不...
    開封第一講書人閱讀 59,626評論 1 296
  • 正文 為了忘掉前任河哑,我火速辦了婚禮,結(jié)果婚禮上龟虎,老公的妹妹穿的比我還像新娘璃谨。我一直安慰自己,他們只是感情好鲤妥,可當(dāng)我...
    茶點故事閱讀 68,625評論 6 397
  • 文/花漫 我一把揭開白布佳吞。 她就那樣靜靜地躺著,像睡著了一般棉安。 火紅的嫁衣襯著肌膚如雪底扳。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,255評論 1 308
  • 那天贡耽,我揣著相機與錄音衷模,去河邊找鬼。 笑死蒲赂,一個胖子當(dāng)著我的面吹牛阱冶,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播滥嘴,決...
    沈念sama閱讀 40,825評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼木蹬,長吁一口氣:“原來是場噩夢啊……” “哼绽昏!你這毒婦竟也來了今妄?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,729評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎是尖,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體泥耀,經(jīng)...
    沈念sama閱讀 46,271評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡饺汹,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,363評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了痰催。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片兜辞。...
    茶點故事閱讀 40,498評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡迎瞧,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出逸吵,到底是詐尸還是另有隱情凶硅,我是刑警寧澤,帶...
    沈念sama閱讀 36,183評論 5 350
  • 正文 年R本政府宣布扫皱,位于F島的核電站足绅,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏韩脑。R本人自食惡果不足惜氢妈,卻給世界環(huán)境...
    茶點故事閱讀 41,867評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望段多。 院中可真熱鬧首量,春花似錦、人聲如沸进苍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽觉啊。三九已至生百,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間柄延,已是汗流浹背蚀浆。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留搜吧,地道東北人市俊。 一個月前我還...
    沈念sama閱讀 48,906評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像滤奈,于是被迫代替她去往敵國和親摆昧。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,507評論 2 359