吳恩達(dá)DL課程學(xué)習(xí)筆記——NN & DL（第三周）

第三周——淺層神經(jīng)網(wǎng)絡(luò)

1嗅定、神經(jīng)網(wǎng)絡(luò)概述

比較簡(jiǎn)單自娩，沒(méi)有什么需要筆記記錄的。

2、神經(jīng)網(wǎng)絡(luò)表示

（1）只有一個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò)忙迁，三層NN：輸入層脐彩、隱藏層、輸出層姊扔；兩層NN：隱藏層惠奸、輸出層。
（2）由于輸入層沒(méi)有任何參數(shù)需要去學(xué)習(xí)恰梢，所以并不把輸入層視做標(biāo)準(zhǔn)的一層佛南，所以感知器亦稱為單層NN，即它只有輸出層嵌言。
（3）輸入層亦稱之為第零層嗅回，隱藏層為第一層，每一層會(huì)將激活值饋送給下一層摧茴，變量a表示這是激活值向量绵载。

3、計(jì)算NN的輸出

（1）帶有非線性激活函數(shù)的神經(jīng)元堆疊形成層苛白，層堆疊形成網(wǎng)絡(luò)娃豹。
（2）權(quán)重矩陣的某一行，行向量购裙，對(duì)應(yīng)于該層某個(gè)神經(jīng)單元的權(quán)重向量懂版，偏置向量的某一個(gè)元素則對(duì)應(yīng)于該層某個(gè)神經(jīng)單元的偏置值。
（3）向量化躏率，沿著豎方向進(jìn)行堆疊定续，于是就得到了W、b禾锤、z和a。
（4）隱藏層得到輸入樣本新的表示形式摹察，即特征向量恩掷，輸出層就是一個(gè)線性分類器（線性模型+將輸出歸一化使得具有概率意義），例如用于二分類的logistic回歸和用于多分類的softmax回歸供嚎，通過(guò)計(jì)算輸入樣本屬于各個(gè)類別的概率來(lái)預(yù)測(cè)輸入樣本的類別黄娘。

4、多樣本向量化

（1）向量化的好處克滴，可以避免寫顯示的for循環(huán)逼争，這樣就不用寫一堆的角標(biāo)用于指定這是哪一個(gè)樣本或是那一層，使得代碼足夠簡(jiǎn)潔劝赔，不容易出錯(cuò)誓焦。
（2）另外通過(guò)向量化，可以使用numpy內(nèi)置的相關(guān)函數(shù)着帽，做element wise的操作和向量矩陣計(jì)算等杂伟，numpy基于經(jīng)典的線性代數(shù)庫(kù)BLAS（C/C++寫的）移层，使用CPU/GPU（GPU不確定？）支持的SIMD指令赫粥，數(shù)據(jù)并行观话，加快代碼的運(yùn)行速度，所以看DL框架的源代碼越平，是看不到多線程相關(guān)的代碼的频蛔。

5、向量化實(shí)現(xiàn)的解釋

沒(méi)什么好解釋的秦叛，就是：Z=WX+b; A=sigmoid(Z)晦溪。

6、激活函數(shù)

（1）tanh函數(shù)的效果幾乎總是比sigmoid好书闸，所以隱藏層幾乎不會(huì)使用sigmoid來(lái)引入非線性尼变。
（2）當(dāng)構(gòu)建二分類模型的時(shí)候，輸出層使用sigmoid使得輸出歸一化為輸入樣本屬于正類的概率浆劲。
（3）由于S型函數(shù)存在導(dǎo)數(shù)趨近于零的區(qū)域嫌术，故在反向傳播鏈?zhǔn)角髮?dǎo)的時(shí)候，會(huì)導(dǎo)致梯度趨近于零牌借，使得訓(xùn)練速度變慢度气。
（4）ReLU函數(shù)在z=0處不可微（可微必可導(dǎo)，可導(dǎo)必可微膨报；可導(dǎo)必連續(xù)磷籍，連續(xù)不一定可導(dǎo)），導(dǎo)數(shù)沒(méi)有定義（編程的時(shí)候现柠，z=0處的導(dǎo)數(shù)可以為0也可以為1院领，喜歡就好），事實(shí)上z=0的概率極低够吩；它的另外一個(gè)缺點(diǎn)比然，當(dāng)z<0時(shí)，導(dǎo)數(shù)為零周循。
（5）Leaky ReLU强法，a=max(0.01z, z)；不過(guò)由于有足夠多的隱藏單元使得z往往都大于零湾笛，故實(shí)際應(yīng)用中還是常用ReLU饮怯。

7、為什么需要非線性激活函數(shù)

（1）如果隱藏層神經(jīng)單元都使用線性激活函數(shù)嚎研，則任意多層的MLP都可以約簡(jiǎn)為感知機(jī)蓖墅，即依然只是一個(gè)線性模型，即模型的輸出依然只是輸入特征的線性組合，無(wú)法解決非線性問(wèn)題置媳，更多詳見(jiàn) 多層感知機(jī)/器-MLP于樟。
（2）如果是回歸問(wèn)題，即輸入輸入對(duì)的輸出（樣本的標(biāo)簽）為連續(xù)值拇囊，則輸出層可以使用線性激活函數(shù)迂曲。

8、計(jì)算激活函數(shù)的導(dǎo)數(shù)

（1）a=sigmoid(z), da/dz=a(1-a)寥袭。
（2）a=tanh(z), da/dz=1-a的平方路捧。
（3）ReLU和Leaky ReLU在z=0處不可導(dǎo)。

9传黄、使用梯度下降訓(xùn)練NN

向量化杰扫，沒(méi)什么需要記錄的內(nèi)容

10、直觀理解反向傳播

（1）向量化膘掰，單樣本訓(xùn)練logistic回歸模型章姓。
（2）向量化，單樣本訓(xùn)練NN识埋。
（3）向量化凡伊，多樣本訓(xùn)練NN，如下面兩圖所示：

向量化窒舟，多樣本訓(xùn)練NN

多樣本訓(xùn)練NN——續(xù)前一頁(yè)

11系忙、隨機(jī)初始化（關(guān)于權(quán)重初始化，理解得還不是特別到位惠豺，需要看些論文）

（1）logistic回歸的權(quán)重向量可以被初始化成全零银还，softmax回歸的權(quán)重矩陣亦可。
（2）MLP每一層的權(quán)重矩陣不可以被初始化成全零洁墙，否則網(wǎng)絡(luò)會(huì)不work蛹疯，不過(guò)偏置向量可以初始化成全零。
（3）如果MLP的權(quán)重矩陣被初始化成全零热监，則每一個(gè)神經(jīng)元都在做一樣的計(jì)算捺弦，則輸出的激活值矩陣所有元素均相等；反向傳播時(shí)梯度矩陣dW=dZ*Ai-1狼纬，兩個(gè)所有item皆相等的矩陣相乘得到的新的矩陣所有item亦相等；參數(shù)更新之后骂际，權(quán)重矩陣所有item依然相等疗琉，即某一層每個(gè)神經(jīng)元依然在做一樣的計(jì)算，則最后softmax輸出層計(jì)算得到的該樣本屬于各個(gè)類別的概率將會(huì)是一樣的歉铝，則模型完全不work盈简。
（4）需要將權(quán)重隨機(jī)初始化成一些很小的數(shù)，因?yàn)檩敵鰧涌赡軙?huì)使用sigmoid函數(shù)，則dZ=dA*dA/dZ柠贤，若權(quán)重很大香浩，則Z的元素會(huì)很大或很小（負(fù)數(shù)）臼勉，則dZ的元素會(huì)趨近于零邻吭，導(dǎo)致梯度下降優(yōu)化參數(shù)很慢。

最后編輯于：2018.06.08 19:54:50

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末宴霸，一起剝皮案震驚了整個(gè)濱河市囱晴，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌瓢谢，老刑警劉巖畸写，帶你破解...
沈念sama閱讀 216,372評(píng)論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異氓扛，居然都是意外死亡枯芬，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,368評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門采郎，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)千所，“玉大人，你說(shuō)我怎么就攤上這事尉剩≌媛” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 162,415評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵理茎，是天一觀的道長(zhǎng)黑界。經(jīng)常有香客問(wèn)我，道長(zhǎng)皂林，這世上最難降的妖魔是什么朗鸠？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,157評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮础倍，結(jié)果婚禮上烛占，老公的妹妹穿的比我還像新娘。我一直安慰自己沟启，他們只是感情好忆家，可當(dāng)我...
茶點(diǎn)故事閱讀 67,171評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著德迹，像睡著了一般芽卿。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上胳搞，一...
開(kāi)封第一講書(shū)人閱讀 51,125評(píng)論 1贊 297
城市分裂傳說(shuō)
那天卸例，我揣著相機(jī)與錄音称杨，去河邊找鬼。笑死筷转，一個(gè)胖子當(dāng)著我的面吹牛姑原，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播呜舒，決...
沈念sama閱讀 40,028評(píng)論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼锭汛，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了阴绢？” 一聲冷哼從身側(cè)響起店乐，我...
開(kāi)封第一講書(shū)人閱讀 38,887評(píng)論 0贊 274
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎呻袭，沒(méi)想到半個(gè)月后眨八，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,310評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡左电，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,533評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年廉侧，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片篓足。...
茶點(diǎn)故事閱讀 39,690評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡段誊，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出栈拖，到底是詐尸還是另有隱情连舍，我是刑警寧澤，帶...
沈念sama閱讀 35,411評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布涩哟，位于F島的核電站索赏，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏贴彼。R本人自食惡果不足惜潜腻，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,004評(píng)論 3贊 325
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望器仗。院中可真熱鬧融涣，春花似錦、人聲如沸精钮。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)轨香。三九已至忽你，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間弹沽，已是汗流浹背檀夹。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,812評(píng)論 1贊 268
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留策橘，地道東北人炸渡。一個(gè)月前我還...
沈念sama閱讀 47,693評(píng)論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像丽已，于是被迫代替她去往敵國(guó)和親蚌堵。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,577評(píng)論 2贊 353