吳恩達(dá)DL課程學(xué)習(xí)筆記——NN & DL(第三周)

第三周——淺層神經(jīng)網(wǎng)絡(luò)

1嗅定、神經(jīng)網(wǎng)絡(luò)概述

比較簡(jiǎn)單自娩,沒(méi)有什么需要筆記記錄的。

2、神經(jīng)網(wǎng)絡(luò)表示

(1)只有一個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò)忙迁,三層NN:輸入層脐彩、隱藏層、輸出層姊扔;兩層NN:隱藏層惠奸、輸出層。
(2)由于輸入層沒(méi)有任何參數(shù)需要去學(xué)習(xí)恰梢,所以并不把輸入層視做標(biāo)準(zhǔn)的一層佛南,所以感知器亦稱為單層NN,即它只有輸出層嵌言。
(3)輸入層亦稱之為第零層嗅回,隱藏層為第一層,每一層會(huì)將激活值饋送給下一層摧茴,變量a表示這是激活值向量绵载。

3、計(jì)算NN的輸出

(1)帶有非線性激活函數(shù)的神經(jīng)元堆疊形成層苛白,層堆疊形成網(wǎng)絡(luò)娃豹。
(2)權(quán)重矩陣的某一行,行向量购裙,對(duì)應(yīng)于該層某個(gè)神經(jīng)單元的權(quán)重向量懂版,偏置向量的某一個(gè)元素則對(duì)應(yīng)于該層某個(gè)神經(jīng)單元的偏置值。
(3)向量化躏率,沿著豎方向進(jìn)行堆疊定续,于是就得到了W、b禾锤、z和a。
(4)隱藏層得到輸入樣本新的表示形式摹察,即特征向量恩掷,輸出層就是一個(gè)線性分類器(線性模型+將輸出歸一化使得具有概率意義),例如用于二分類的logistic回歸和用于多分類的softmax回歸供嚎,通過(guò)計(jì)算輸入樣本屬于各個(gè)類別的概率來(lái)預(yù)測(cè)輸入樣本的類別黄娘。

4、多樣本向量化

(1)向量化的好處克滴,可以避免寫顯示的for循環(huán)逼争,這樣就不用寫一堆的角標(biāo)用于指定這是哪一個(gè)樣本或是那一層,使得代碼足夠簡(jiǎn)潔劝赔,不容易出錯(cuò)誓焦。
(2)另外通過(guò)向量化,可以使用numpy內(nèi)置的相關(guān)函數(shù)着帽,做element wise的操作和向量矩陣計(jì)算等杂伟,numpy基于經(jīng)典的線性代數(shù)庫(kù)BLAS(C/C++寫的)移层,使用CPU/GPU(GPU不確定?)支持的SIMD指令赫粥,數(shù)據(jù)并行观话,加快代碼的運(yùn)行速度,所以看DL框架的源代碼越平,是看不到多線程相關(guān)的代碼的频蛔。

5、向量化實(shí)現(xiàn)的解釋

沒(méi)什么好解釋的秦叛,就是:Z=WX+b; A=sigmoid(Z)晦溪。

6、激活函數(shù)

(1)tanh函數(shù)的效果幾乎總是比sigmoid好书闸,所以隱藏層幾乎不會(huì)使用sigmoid來(lái)引入非線性尼变。
(2)當(dāng)構(gòu)建二分類模型的時(shí)候,輸出層使用sigmoid使得輸出歸一化為輸入樣本屬于正類的概率浆劲。
(3)由于S型函數(shù)存在導(dǎo)數(shù)趨近于零的區(qū)域嫌术,故在反向傳播鏈?zhǔn)角髮?dǎo)的時(shí)候,會(huì)導(dǎo)致梯度趨近于零牌借,使得訓(xùn)練速度變慢度气。
(4)ReLU函數(shù)在z=0處不可微(可微必可導(dǎo),可導(dǎo)必可微膨报;可導(dǎo)必連續(xù)磷籍,連續(xù)不一定可導(dǎo)),導(dǎo)數(shù)沒(méi)有定義(編程的時(shí)候现柠,z=0處的導(dǎo)數(shù)可以為0也可以為1院领,喜歡就好),事實(shí)上z=0的概率極低够吩;它的另外一個(gè)缺點(diǎn)比然,當(dāng)z<0時(shí),導(dǎo)數(shù)為零周循。
(5)Leaky ReLU强法,a=max(0.01z, z);不過(guò)由于有足夠多的隱藏單元使得z往往都大于零湾笛,故實(shí)際應(yīng)用中還是常用ReLU饮怯。

7、為什么需要非線性激活函數(shù)

(1)如果隱藏層神經(jīng)單元都使用線性激活函數(shù)嚎研,則任意多層的MLP都可以約簡(jiǎn)為感知機(jī)蓖墅,即依然只是一個(gè)線性模型,即模型的輸出依然只是輸入特征的線性組合,無(wú)法解決非線性問(wèn)題置媳,更多詳見(jiàn) 多層感知機(jī)/器-MLP于樟。
(2)如果是回歸問(wèn)題,即輸入輸入對(duì)的輸出(樣本的標(biāo)簽)為連續(xù)值拇囊,則輸出層可以使用線性激活函數(shù)迂曲。

8、計(jì)算激活函數(shù)的導(dǎo)數(shù)

(1)a=sigmoid(z), da/dz=a(1-a)寥袭。
(2)a=tanh(z), da/dz=1-a的平方路捧。
(3)ReLU和Leaky ReLU在z=0處不可導(dǎo)。

9传黄、使用梯度下降訓(xùn)練NN

向量化杰扫,沒(méi)什么需要記錄的內(nèi)容

10、直觀理解反向傳播

(1)向量化膘掰,單樣本訓(xùn)練logistic回歸模型章姓。
(2)向量化,單樣本訓(xùn)練NN识埋。
(3)向量化凡伊,多樣本訓(xùn)練NN,如下面兩圖所示:


向量化窒舟,多樣本訓(xùn)練NN

多樣本訓(xùn)練NN——續(xù)前一頁(yè)
11系忙、隨機(jī)初始化(關(guān)于權(quán)重初始化,理解得還不是特別到位惠豺,需要看些論文)

(1)logistic回歸的權(quán)重向量可以被初始化成全零银还,softmax回歸的權(quán)重矩陣亦可。
(2)MLP每一層的權(quán)重矩陣不可以被初始化成全零洁墙,否則網(wǎng)絡(luò)會(huì)不work蛹疯,不過(guò)偏置向量可以初始化成全零。
(3)如果MLP的權(quán)重矩陣被初始化成全零热监,則每一個(gè)神經(jīng)元都在做一樣的計(jì)算捺弦,則輸出的激活值矩陣所有元素均相等;反向傳播時(shí)梯度矩陣dW=dZ*Ai-1狼纬,兩個(gè)所有item皆相等的矩陣相乘得到的新的矩陣所有item亦相等;參數(shù)更新之后骂际,權(quán)重矩陣所有item依然相等疗琉,即某一層每個(gè)神經(jīng)元依然在做一樣的計(jì)算,則最后softmax輸出層計(jì)算得到的該樣本屬于各個(gè)類別的概率將會(huì)是一樣的歉铝,則模型完全不work盈简。
(4)需要將權(quán)重隨機(jī)初始化成一些很小的數(shù),因?yàn)檩敵鰧涌赡軙?huì)使用sigmoid函數(shù),則dZ=dA*dA/dZ柠贤,若權(quán)重很大香浩,則Z的元素會(huì)很大或很小(負(fù)數(shù))臼勉,則dZ的元素會(huì)趨近于零邻吭,導(dǎo)致梯度下降優(yōu)化參數(shù)很慢。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末宴霸,一起剝皮案震驚了整個(gè)濱河市囱晴,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌瓢谢,老刑警劉巖畸写,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異氓扛,居然都是意外死亡枯芬,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門采郎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)千所,“玉大人,你說(shuō)我怎么就攤上這事尉剩≌媛” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵理茎,是天一觀的道長(zhǎng)黑界。 經(jīng)常有香客問(wèn)我,道長(zhǎng)皂林,這世上最難降的妖魔是什么朗鸠? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮础倍,結(jié)果婚禮上烛占,老公的妹妹穿的比我還像新娘。我一直安慰自己沟启,他們只是感情好忆家,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著德迹,像睡著了一般芽卿。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上胳搞,一...
    開(kāi)封第一講書(shū)人閱讀 51,125評(píng)論 1 297
  • 那天卸例,我揣著相機(jī)與錄音称杨,去河邊找鬼。 笑死筷转,一個(gè)胖子當(dāng)著我的面吹牛姑原,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播呜舒,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼锭汛,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了阴绢?” 一聲冷哼從身側(cè)響起店乐,我...
    開(kāi)封第一講書(shū)人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎呻袭,沒(méi)想到半個(gè)月后眨八,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡左电,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年廉侧,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片篓足。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡段誊,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出栈拖,到底是詐尸還是另有隱情连舍,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布涩哟,位于F島的核電站索赏,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏贴彼。R本人自食惡果不足惜潜腻,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望器仗。 院中可真熱鬧融涣,春花似錦、人聲如沸精钮。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)轨香。三九已至忽你,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間弹沽,已是汗流浹背檀夹。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留策橘,地道東北人炸渡。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像丽已,于是被迫代替她去往敵國(guó)和親蚌堵。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容