Deep learning 中的數(shù)學(xué)基礎(chǔ)知識(shí)

1.微積分

導(dǎo)數(shù):一個(gè)函數(shù)在某一點(diǎn)的導(dǎo)數(shù)描述了這個(gè)函數(shù)在這一點(diǎn)附近的變化率竟趾。
$$
f'(a) = \lim_{h \rightarrow 0} \frac{f(a+h)-f(a)}{h}
$$
梯度:多元函數(shù)的導(dǎo)數(shù)就是梯度伸蚯。

一階導(dǎo)數(shù)和梯度(gradient)

? $f'(x)$ ;
$$
\nabla f(\bf{X}) = \frac{\partial f(\bf{X})}{\partial \bf{X}} = \begin{bmatrix}
\frac{\partial f(\bf{X})}{\partial {x_1}} \
\frac{\partial f(\bf{X})}{\partial {x_2}} \
\vdots\
\frac{\partial f(\bf{X})}{\partial {x_n}} \
\end{bmatrix}
$$
二階導(dǎo)數(shù)與Hessian矩陣

$f''(x)$;
$$
\bf{H}(x)= \nabla^2f(\bf{X}) = \begin{bmatrix}
\frac{\partial ^2 f(\bf{X})}{\partial {x_1}^2} & \frac{\partial ^2 f(\bf{X})}{\partial {x_1}\partial {x_2}} & \cdots & \frac{\partial ^2 f(\bf{X})}{\partial {x_1}\partial {x_n}} &\
\frac{\partial ^2 f(\bf{X})}{\partial {x_2}\partial {x_1}} & \frac{\partial ^2 f(\bf{X})}{\partial {x_2}^2} & \cdots & \frac{\partial ^2 f(\bf{X})}{\partial {x_2}\partial {x_n}} &\
\vdots & \vdots & \ddots & \vdots \
\frac{\partial ^2 f(\bf{X})}{\partial {x_n}\partial {x_1}} & \frac{\partial ^2 f(\bf{X})}{\partial {x_n}\partial {x_2}} & \cdots & \frac{\partial ^2 f(\bf{X})}{\partial {x_n}^2} &\
\end{bmatrix}
$$
泰勒級數(shù)

輸入為標(biāo)量的泰勒級數(shù):
$$
f(x_k + \delta) \approx f(x_k) +f'(x_k)\delta + \frac{1}{2}f''(x_k)\delta^2 + \cdots +\frac{1}{n!}f{(n)}(x_k)\deltan
$$
輸入為矢量的泰勒級數(shù)(前三項(xiàng)):
$$
f(\bf{x}_k + \bf{\delta}) \approx f(x_k) +\nabla^Tf(\bf{x}_k) \bf{\delta} + \frac{1}{2}\bf{\delta^T}f''(\bf{x}_k)\bf{\delta}
$$
此時(shí) 滿足 $\nabla^T f(\bf{x}_k) =0?$ 的點(diǎn)為平穩(wěn)點(diǎn)饵筑,如果還有:

? $\nabla^2 f(\bf{x}_k) > 0$ 舒憾,即 為正定矩陣巩割,則 $\bf{x}_k$為一嚴(yán)格局部極小值點(diǎn)(反之删性,嚴(yán)格局部極大值點(diǎn))

? 如果 $\nabla^2 f(\bf{x}_k) =0$ 沃疮,即為不定矩陣葫辐,則是一個(gè)鞍點(diǎn)(如 $f(x)=x^3,x=0$時(shí))章喉,此時(shí)需要考慮三階導(dǎo)數(shù)汗贫。

問題為什么優(yōu)化時(shí)選擇梯度方向,梯度方向?yàn)槭裁词亲兓羁斓姆较颍?/em>

:由泰勒級數(shù)展開式的前兩項(xiàng) $f(\bf{x}_k + \bf{\delta}) \approx f(x_k) +\nabla^Tf(\bf{x}_k) \bf{\delta} $ 可知秸脱,當(dāng)$\delta$ 是一個(gè)模不變但方向不確定的矢量時(shí)落包,此時(shí) $f(\bf{x}_k + \bf{\delta}) - f(x_k) \approx \nabla^Tf(\bf{x}_k) \bf{\delta} $ , 可知,當(dāng) $\delta = \nabla f(\bf{x}_k)$ 時(shí)摊唇,$\nabla^Tf(\bf{x}_k) \bf{\delta} = ||\nabla^2(\bf{x}_k) || $ ,此時(shí)取得最大的差值咐蝇,也就是說 $\delta$ 取梯度方向是變化最大。 梯度下降法中的迭代方法就是負(fù)梯度方向巷查,因?yàn)樵摲较蛳陆底羁欤?/strong>

2. 概率論

隨機(jī)變量

累積分布函數(shù)

概率密度函數(shù)

高斯分布

獨(dú)立同分布定理

3. 線性代數(shù)

方陣的特征值(Eigenvalues)與特征向量(Eigenvectors)
$$
\bf{Ax}= \lambda \bf{x}
$$

特征向量

特征值和特征向量的幾何意義與物理意義**:

矩陣是數(shù)學(xué)中非常抽象的一個(gè)概念有序,廣義上我們可以將矩陣看作一個(gè)運(yùn)動(dòng)。即矩陣乘法對應(yīng)了一個(gè)變換岛请,是把任意一個(gè)向量變成另一個(gè)方向或長度都大多不同的新向量旭寿。在這個(gè)變換過程中,原向量主要發(fā)生旋轉(zhuǎn)崇败、伸縮的變化盅称。 如果矩陣對某個(gè)或某些向量只發(fā)生伸縮變換,而不對這些向量產(chǎn)生旋轉(zhuǎn)的效果,那么這些向量就稱作這個(gè)矩陣的特征向量缩膝,伸縮的比例就是特征值混狠。其物理意義就是運(yùn)動(dòng)的圖景:特征向量在一個(gè)矩陣的作用下作伸縮運(yùn)動(dòng),伸縮的幅度由特征值確定逞盆。

特征值示意圖

特征分解的性質(zhì)

對于 $\bf{Ax_i} = \lambda \bf{x_i}$ 檀蹋,如果所有的特征值都不相同,則對應(yīng)的所有特征向量都線性無關(guān)云芦。此時(shí) $\bf{A}$ 可以被對角化為:
$$
\bf{A=V \Lambda V^{-1}}
$$
其中 $\bf{V=[x_1,x_2,\cdots,x_n]}$ , $\Lambda = Diag (\lambda_1,\lambda_2,\cdots, \lambda_n)$ 俯逾。

并不是所有的方陣都可以被對角化,這里主要考慮對稱矩陣($A= A^T$)的特征分解舅逸。

如果一個(gè)對稱矩陣的特征值都不相同桌肴,則其相應(yīng)的所有特征向量正交。($\bf{UUT=UTU=I}$)
$$
\begin{split} \bf{A =U \Lambda U^T=\begin{bmatrix} u_1,u_2,\cdots,u_n \end{bmatrix} } \begin{bmatrix}\lambda_1 & &\ & \ddots &\ & & \lambda_n\end{bmatrix} \begin{bmatrix} \bf{u_1^T\ u_2^T\ \vdots\u_n^T} \end{bmatrix} = \sum_{i=1}^n \lambda_i \bf{u_iu_i^T}
\end{split}
$$
對稱矩陣的特征值都是實(shí)數(shù)琉历。

二次型**(Quadratic Form):

給定矩陣 $\bf{A} \in R^{m \times n}$ 坠七,函數(shù)
$$
\bf{x^TAx=\sum\sum}x_ix_ja_{ij}
$$
被稱為二次型。

如果對于所有 $\bf{x} \in R^n$ 旗笔,有 $\bf{x^TAx} \geq 0$ 彪置,則為半正定矩陣,此時(shí) $\lambda(\bf{A}) \geq 0$ .

特征分解的應(yīng)用——PCA的本質(zhì)

PCA的本質(zhì)就是協(xié)方差矩陣的對角化蝇恶。

4. 凸優(yōu)化問題

凸集:一個(gè)集合中任意兩點(diǎn)的連線都在該集合中拳魁,則這個(gè)集合是一個(gè)凸集。

一個(gè)函數(shù) $f$ 是凸函數(shù)撮弧,滿足:

  • 它的定義域是凸集潘懊;

  • 對于定義域中的任意兩點(diǎn) $x_1$、 $x_2$贿衍, 對任意 $0 \leq \alpha \leq 1$授舟, 有

$$
f(\alpha x_1 +(1-\alpha)x_2) \leq \alpha f(x_1) + (1-\alpha) f(x_2)
$$

機(jī)器學(xué)習(xí)中的凸優(yōu)化問題是一類特殊的優(yōu)化問題。凸優(yōu)化問題的形式是
$$
\min_{x\in S}f(x)
$$
其中 $f(x)$是凸函數(shù)贸辈,可行域 $S$ 是凸集释树。或等價(jià)為:
$$
\min_xf(x) \ \text{subject to} \quad g_i(x) \leq 0, \text{for} \quad i=1,2,\cdots,k
$$
其中$f(x)$ 和所有的約束函數(shù) $g_i(x)都是凸函數(shù)裙椭。

凸優(yōu)化問題的性質(zhì):它的局部最優(yōu)解一定是全局最優(yōu)解躏哩。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市揉燃,隨后出現(xiàn)的幾起案子扫尺,更是在濱河造成了極大的恐慌,老刑警劉巖炊汤,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件正驻,死亡現(xiàn)場離奇詭異弊攘,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)姑曙,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門襟交,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人伤靠,你說我怎么就攤上這事捣域。” “怎么了宴合?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵焕梅,是天一觀的道長。 經(jīng)常有香客問我卦洽,道長贞言,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任阀蒂,我火速辦了婚禮该窗,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蚤霞。我一直安慰自己酗失,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布昧绣。 她就那樣靜靜地躺著级零,像睡著了一般。 火紅的嫁衣襯著肌膚如雪滞乙。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天鉴嗤,我揣著相機(jī)與錄音斩启,去河邊找鬼。 笑死醉锅,一個(gè)胖子當(dāng)著我的面吹牛兔簇,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播硬耍,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼垄琐,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了经柴?” 一聲冷哼從身側(cè)響起狸窘,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎坯认,沒想到半個(gè)月后翻擒,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體氓涣,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年陋气,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了劳吠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,577評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡巩趁,死狀恐怖痒玩,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情议慰,我是刑警寧澤蠢古,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站褒脯,受9級特大地震影響便瑟,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜番川,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一到涂、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧颁督,春花似錦践啄、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至吠裆,卻和暖如春伐谈,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背试疙。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工诵棵, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人祝旷。 一個(gè)月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓履澳,卻偏偏與公主長得像,于是被迫代替她去往敵國和親怀跛。 傳聞我的和親對象是個(gè)殘疾皇子距贷,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 文章作者:Tyan博客:noahsnail.com | CSDN | 簡書 聲明:作者翻譯論文僅為學(xué)習(xí),如有侵權(quán)請...
    SnailTyan閱讀 5,065評論 0 8
  • 第二章 機(jī)器學(xué)習(xí)中的線性代數(shù)知識(shí) 線性代數(shù)作為數(shù)學(xué)中的一個(gè)重要的分支吻谋,廣發(fā)應(yīng)用在科學(xué)與工程中忠蝗。掌握好線性代數(shù)對于理...
    Vinicer閱讀 1,672評論 0 5
  • 1. 身在外地的我什湘,每次和家里打電話的時(shí)候长赞,母親都會(huì)對我說:“別太累了∶龀罚” 父母知道我出去兼職得哆,都說,“別去了哟旗,沒...
    莯玖一閱讀 3,697評論 4 4
  • 1查看分支 1.1查看遠(yuǎn)程分支: 1.2查看本地分支: 2 合并分支闸餐、解決沖突 2.1如何分支的合并 在git中饱亮,...
    郭之源閱讀 4,811評論 0 0
  • 引言:去夏令營期間聽了好多次區(qū)塊鏈這個(gè)詞,今天來學(xué)習(xí)一下 區(qū)塊鏈?zhǔn)欠植际綌?shù)據(jù)存儲(chǔ)舍沙、點(diǎn)對點(diǎn)傳輸近上、共識(shí)機(jī)制、加密算法等...
    sereny閱讀 131評論 0 0