Task06:批量歸一化和殘差網(wǎng)絡(luò)蹭秋;凸優(yōu)化;梯度下降

批量歸一化(BatchNormalization)

對輸入的標準化(淺層模型)

處理后的任意一個特征在數(shù)據(jù)集中所有樣本上的均值為0堤撵、標準差為1仁讨。
標準化處理輸入數(shù)據(jù)使各個特征的分布相近

批量歸一化(深度模型)

利用小批量上的均值和標準差,不斷調(diào)整神經(jīng)網(wǎng)絡(luò)中間輸出粒督,從而使整個神經(jīng)網(wǎng)絡(luò)在各層的中間輸出的數(shù)值更穩(wěn)定陪竿。

1.對全連接層做批量歸一化

位置:全連接層中的仿射變換和激活函數(shù)之間。

2.對卷積層做批量歸?化

位置:卷積計算之后屠橄、應(yīng)?激活函數(shù)之前族跛。
如果卷積計算輸出多個通道,我們需要對這些通道的輸出分別做批量歸一化锐墙,且每個通道都擁有獨立的拉伸和偏移參數(shù)礁哄。 計算:對單通道,batchsize=m,卷積計算輸出=pxq 對該通道中m×p×q個元素同時做批量歸一化,使用相同的均值和方差溪北。

3.預(yù)測時的批量歸?化

訓(xùn)練:以batch為單位,對每個batch計算均值和方差桐绒。
預(yù)測:用移動平均估算整個訓(xùn)練數(shù)據(jù)集的樣本均值和方差。

殘差網(wǎng)絡(luò)(ResNet)

深度學(xué)習(xí)的問題:深度CNN網(wǎng)絡(luò)達到一定深度后再一味地增加層數(shù)并不能帶來進一步地分類性能提高之拨,反而會招致網(wǎng)絡(luò)收斂變得更慢茉继,準確率也變得更差。

殘差塊(Residual Block)

恒等映射:
左邊:f(x)=x
右邊:f(x)-x=0 (易于捕捉恒等映射的細微波動)


殘差網(wǎng)絡(luò)

稠密連接網(wǎng)絡(luò)(DenseNet)

稠密連接網(wǎng)絡(luò)

主要構(gòu)建模塊:

稠密塊(dense block): 定義了輸入和輸出是如何連結(jié)的蚀乔。
過渡層(transition layer):用來控制通道數(shù)烁竭,使之不過大。

過渡層

  • 1??1卷積層:來減小通道數(shù)
  • 步幅為2的平均池化層:減半高和寬

凸優(yōu)化

  • 優(yōu)化方法目標:訓(xùn)練集損失函數(shù)值
  • 深度學(xué)習(xí)目標:測試集損失函數(shù)值(泛化性)

優(yōu)化在深度學(xué)習(xí)中的挑戰(zhàn)

  1. 局部最小值
  2. 鞍點
  3. 梯度消失

局部最小值[]

f(x)=xcos\pi x

def f(x):
    return x * np.cos(np.pi * x)

d2l.set_figsize((4.5, 2.5))
x = np.arange(-1.0, 2.0, 0.1)
fig,  = d2l.plt.plot(x, f(x))
fig.axes.annotate('local minimum', xy=(-0.3, -0.25), xytext=(-0.77, -1.0),
                  arrowprops=dict(arrowstyle='->'))
fig.axes.annotate('global minimum', xy=(1.1, -0.95), xytext=(0.6, 0.8),
                  arrowprops=dict(arrowstyle='->'))
d2l.plt.xlabel('x')
d2l.plt.ylabel('f(x)');


鞍點

x = np.arange(-2.0, 2.0, 0.1)
fig, = d2l.plt.plot(x, x**3)
fig.axes.annotate('saddle point', xy=(0, -0.2), xytext=(-0.52, -5.0),
                  arrowprops=dict(arrowstyle='->'))
d2l.plt.xlabel('x')
d2l.plt.ylabel('f(x)');

梯度消失

x = np.arange(-2.0, 5.0, 0.01)
fig, = d2l.plt.plot(x, np.tanh(x))
d2l.plt.xlabel('x')
d2l.plt.ylabel('f(x)')
fig.axes.annotate('vanishing gradient', (4, 1), (2, 0.0) ,arrowprops=dict(arrowstyle='->'))

凸性

函數(shù)

\lambda f(x)+(1-\lambda )f(x’)\ge f{\lambda x+(1-\lambda )x’}

def f(x):
    return 0.5 * x**2  # Convex

def g(x):
    return np.cos(np.pi * x)  # Nonconvex

def h(x):
    return np.exp(0.5 * x)  # Convex

x, segment = np.arange(-2, 2, 0.01), np.array([-1.5, 1])
d2l.use_svg_display()
_, axes = d2l.plt.subplots(1, 3, figsize=(9, 3))

for ax, func in zip(axes, [f, g, h]):
    ax.plot(x, func(x))
    ax.plot(segment, func(segment),'--', color="purple")
    # d2l.plt.plot([x, segment], [func(x), func(segment)], axes=ax)

Jensen不等式

Jensen不等式

性質(zhì)

  • 無局部極小值
  • 與凸集的關(guān)系
  • 二階條件

無局部最小值

證明:假設(shè)存在x\in X是局部最小值吉挣,則存在全局最小值x’\in X,使得f(x)>f(x’),則對\lambda \in (0,1],
f(x)>\lambda f(x)+(1-\lambda )f(x’) \ge f(\lambda x+(1-\lambda )x’)

與凸集的關(guān)系

對于凸函數(shù)f(x),定義集合S_b :=\{x|x\in X \ and\ f(x) \le b\}
則集合S_b為凸集

證明:對于點x,x’\in S_b,f(\lambda x+(1-\lambda )x’)\le \lambda f(x)+(1-\lambda )f(x’) \le b,
\lambda x+(1-\lambda )x’\in S_b,
f(x,y)=0.5x^2+cos(2\pi y)


In [12]:
x, y = np.meshgrid(np.linspace(-1, 1, 101), np.linspace(-1, 1, 101),
                   indexing='ij')

z = x**2 + 0.5 * np.cos(2 * np.pi * y)

# Plot the 3D surface
d2l.set_figsize((6, 4))
ax = d2l.plt.figure().add_subplot(111, projection='3d')
ax.plot_wireframe(x, y, z, **{'rstride': 10, 'cstride': 10})
ax.contour(x, y, z, offset=-1)
ax.set_zlim(-1, 1.5)

# Adjust labels
for func in [d2l.plt.xticks, d2l.plt.yticks, ax.set_zticks]:
    func([-1, 0, 1])
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末派撕,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子睬魂,更是在濱河造成了極大的恐慌终吼,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,496評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件氯哮,死亡現(xiàn)場離奇詭異际跪,居然都是意外死亡,警方通過查閱死者的電腦和手機喉钢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,187評論 3 385
  • 文/潘曉璐 我一進店門姆打,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人出牧,你說我怎么就攤上這事穴肘⌒危” “怎么了舔痕?”我有些...
    開封第一講書人閱讀 157,091評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我伯复,道長慨代,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,458評論 1 283
  • 正文 為了忘掉前任啸如,我火速辦了婚禮侍匙,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘叮雳。我一直安慰自己想暗,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,542評論 6 385
  • 文/花漫 我一把揭開白布帘不。 她就那樣靜靜地躺著说莫,像睡著了一般。 火紅的嫁衣襯著肌膚如雪寞焙。 梳的紋絲不亂的頭發(fā)上储狭,一...
    開封第一講書人閱讀 49,802評論 1 290
  • 那天,我揣著相機與錄音捣郊,去河邊找鬼辽狈。 笑死,一個胖子當(dāng)著我的面吹牛呛牲,可吹牛的內(nèi)容都是我干的刮萌。 我是一名探鬼主播,決...
    沈念sama閱讀 38,945評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼侈净,長吁一口氣:“原來是場噩夢啊……” “哼尊勿!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起畜侦,我...
    開封第一講書人閱讀 37,709評論 0 266
  • 序言:老撾萬榮一對情侶失蹤元扔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后旋膳,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體澎语,經(jīng)...
    沈念sama閱讀 44,158評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,502評論 2 327
  • 正文 我和宋清朗相戀三年验懊,在試婚紗的時候發(fā)現(xiàn)自己被綠了擅羞。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,637評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡义图,死狀恐怖减俏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情碱工,我是刑警寧澤娃承,帶...
    沈念sama閱讀 34,300評論 4 329
  • 正文 年R本政府宣布奏夫,位于F島的核電站,受9級特大地震影響历筝,放射性物質(zhì)發(fā)生泄漏酗昼。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,911評論 3 313
  • 文/蒙蒙 一梳猪、第九天 我趴在偏房一處隱蔽的房頂上張望麻削。 院中可真熱鬧,春花似錦春弥、人聲如沸呛哟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,744評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽竖共。三九已至,卻和暖如春俺祠,著一層夾襖步出監(jiān)牢的瞬間公给,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,982評論 1 266
  • 我被黑心中介騙來泰國打工蜘渣, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留淌铐,地道東北人。 一個月前我還...
    沈念sama閱讀 46,344評論 2 360
  • 正文 我出身青樓蔫缸,卻偏偏與公主長得像腿准,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子拾碌,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,500評論 2 348

推薦閱讀更多精彩內(nèi)容