以下有部分公式推姻,如果無法顯示,請訪問原文鏈接
從本文開始监徘,之后的三四篇我們都將沐浴在數(shù)學的海洋里,拼命地撲騰吧碾,這個系列我會盡力以通俗易懂的方式來講述這些數(shù)學知識凰盔。
1 函數(shù)
1.1 一次函數(shù)
在數(shù)學函數(shù)中最基本、最重要的就是一次函數(shù)
倦春。也就是函數(shù)之基礎(chǔ)户敬、根本。它在神經(jīng)網(wǎng)絡(luò)的世界里也同樣重要睁本。
1.1.1 一元一次函數(shù)
這個函數(shù)可以用下面的式表示尿庐。被稱為斜率
(用來控制直線的方向),被稱為截距
(用來控制直線和原點的偏移)
當x、y兩個變量滿足上述公式時枉疼,就稱為變量y和變量x是一次函數(shù)關(guān)系
皮假。
有兩個變量和,如果對每個都有唯一確定的與它對應(yīng)骂维,則稱是的函數(shù)惹资,用 表示。此時航闺,稱為自變量褪测,為因變量猴誊。
一次函數(shù)的圖像是直線,如下圖的直線所示侮措。
示例:一次函數(shù)的圖像如下圖所示懈叹,截距為 1,斜率為 2萝毛。
1.1.2 多元一次函數(shù)
上面我們說的中有一個變量x项阴,我們稱為一元,如果有多個變量笆包,我們就稱為是多元的,比如下面的式子略荡。(有幾個變量就是幾元的庵佣,也可以理解為維度)
當多個變量滿足上述公式時粥谬,也稱為變量y與變量是一次函數(shù)關(guān)系
肛根。
就像我們之前說的神經(jīng)元的加權(quán)輸入
就可以表示為一次函數(shù)關(guān)系。如果把作為參數(shù)的權(quán)重與偏置看作常數(shù)掺喻,那么加權(quán)輸入h和就是一次函數(shù)關(guān)系褂乍。
1.2 二次函數(shù)
1.2.1 一元二次函數(shù)
剛剛我們接觸了一次函數(shù),下面說說二次函數(shù)即硼。二次函數(shù)很重要逃片,像我們經(jīng)常使用的代價函數(shù)
平方誤差就是二次函數(shù)。二次函數(shù)由下面的式表示只酥。
二次函數(shù)的圖像是拋物線性锭,如下圖所示。我們會發(fā)現(xiàn)拋物線的凹凸(開口朝向)是通過上方式子中的正負來決定的叫胖。
- 當時草冈,拋物線向上開口,向下凸起
- 當時,拋物線向下開口怎棱,向上凸起哩俭。
所以當時該函數(shù)的存在最小值。(該性質(zhì)是后面講的最小二乘法的
基礎(chǔ))
示例:二次函數(shù)的圖像如右圖所示拳恋。從圖像中可以看到凡资,當時,函數(shù)取得最小值谬运。
1.2.2 多元二次函數(shù)
在我們實際的神經(jīng)網(wǎng)絡(luò)中需要處理更多變量的二次函數(shù)隙赁,這些二次函數(shù)統(tǒng)稱多元二次函數(shù)
,學會了一元二次函數(shù)梆暖,那么多元二次函數(shù)就不會太難了伞访,下面我們以一個二元二次函數(shù)進行舉例。
就像我們使用的代價函數(shù)平方誤差c就是多元二次函數(shù):
1.3 單位階躍函數(shù)
之前轰驳,我們已經(jīng)接觸過它了厚掷,還記得嗎,作為生物界神經(jīng)元的激活函數(shù)级解。下面我們再說一遍吧冒黑。
單位階躍函數(shù),在原點處不連續(xù)
勤哗,也就是在原點處不可導
抡爹,由于這兩個性質(zhì),所以單位階躍函數(shù)不能成為主要的激活函數(shù)俺陋。
單位階躍函數(shù)的圖像如下:
1.4 指數(shù)函數(shù)
什么是指數(shù)函數(shù)呢豁延?我們之前講了一次函數(shù)和二次函數(shù),其實只要把變量放到冪的位置腊状,其實就是指數(shù)函數(shù)了诱咏,具有以下形狀的函數(shù)稱為指數(shù)函數(shù)
,常數(shù)被稱為函數(shù)的底數(shù)
缴挖。
指數(shù)函數(shù)的圖像是類似于撇的一種樣式,如下所示
上面說到底數(shù)映屋,就不得不說自然常數(shù)
,又叫納皮爾數(shù)或歐拉數(shù)苟鸯,它和派類似,是一個無限不循環(huán)小數(shù)棚点,它的值如下
1.4.1 sigmoid函數(shù)
上面說到自然常數(shù)e早处,那么就不得不提到大名鼎鼎的自然指數(shù)函數(shù),它在數(shù)學界有自己的標識exp
或exp(x)
而我們這里所要講的是包含自然指數(shù)函數(shù)的復(fù)合函數(shù)sigmoid
函數(shù),它是神經(jīng)網(wǎng)絡(luò)中很具有代表性的激活函數(shù)瘫析。它的公式如下
通過下方的圖像,我們可以看到砌梆,這個函數(shù)是光滑的
默责,這就代表著這個函數(shù)處處可導
,函數(shù)的取值在(0,1)區(qū)間內(nèi)咸包,那么這個函數(shù)值就可以用概率來解釋
1.5 正態(tài)分布的概率密度函數(shù)
在計算機實際確定神經(jīng)網(wǎng)絡(luò)時桃序,我們需要首先給權(quán)重和偏置設(shè)定初始值,這樣神經(jīng)網(wǎng)絡(luò)才能進行計算烂瘫。而這個初始值怎么取呢媒熊,這個時候我們就會用到一個非常有用的工具,叫做正態(tài)分布
坟比,這里就不長篇大論的解釋啥是正態(tài)分布了芦鳍,它也沒什么高大上的地方,就是概率分布中的一種分布方式葛账,但是這個分布方式是及其復(fù)合人類和自然界的怜校,有興趣的朋友可以去深入了解下。在這里只說一下注竿,我們在給神經(jīng)網(wǎng)絡(luò)分配權(quán)重和偏置時分配一個服從正態(tài)分布的隨機數(shù),會比較容易取得好的結(jié)果魂贬。
正態(tài)分布是服從下面的概率密度函數(shù)的概率分布巩割。公式如下
- 常數(shù):期望值(平均值)
- :標注差
它的圖像如下须眷,由于形狀像教堂的鐘为黎,所以被稱為叫鐘形曲線
示例:試作出期望值為0锈至、標準差為1 的正態(tài)分布的概率密度函數(shù)的圖像佑力。
2 數(shù)列
2.1 數(shù)列的含義
數(shù)列
就是數(shù)的序列级历,比如下面就是偶數(shù)列的數(shù)列
數(shù)列中的每一個數(shù)都被稱為項
腥光,排在第一位的項叫做首項
懒构,排在第二位的項叫做第2項
,以此類推众羡,排在第n位的項叫做第n項
(是不是有點廢話)勋颖,神經(jīng)網(wǎng)絡(luò)中出現(xiàn)的數(shù)列都是有限的數(shù)列嗦嗡,這種數(shù)列叫做有窮數(shù)列
,在有窮數(shù)列中最后一項稱為末項
,數(shù)列中的數(shù)量稱為項數(shù)
,而像上面的偶數(shù)列是無窮數(shù)列
示例:考察下面的有窮數(shù)列的首項饭玲,末項以及項數(shù)
這個數(shù)列的首項是1侥祭,末項是9,項數(shù)是5
2.2 數(shù)列的通項公式
數(shù)列中排在第項的數(shù)通常用表示茄厘,這里是數(shù)列的名字矮冬,可隨意取。當想要表達整個數(shù)列時次哈,使用集合的符號來表示胎署,如
將數(shù)列的第項用一個關(guān)于的式子標書出來,那么這個式子被稱為通項公式
窑滞,比如偶數(shù)列的通項公式就是下方的式子
示例:求以下數(shù)列的通項公式
通項公式為
在神經(jīng)網(wǎng)絡(luò)中琼牧,神經(jīng)元的加權(quán)輸入和輸出可以看成數(shù)列恢筝,比如使用下方的展示方式:
- 加權(quán)輸入:第層的第個神經(jīng)元的加權(quán)輸入用
- 輸出:第層的第個神經(jīng)元的輸出用
2.3 數(shù)列與遞推關(guān)系式
除了通項公式外,數(shù)列還有另外一種表示方式障陶,就是用相鄰的關(guān)系式來表示滋恬,這種表示法被稱為數(shù)列的遞歸定義
一般,如果已知首項以及相鄰的兩項的關(guān)系式恢氯,那么就可以確定這個序列,這個關(guān)系式叫遞推關(guān)系式
示例:已知首項以及關(guān)系式鼓寺,可以確定以下數(shù)列勋拟,這個關(guān)系式就是數(shù)列的遞推關(guān)系式。
2.4 聯(lián)立遞推關(guān)系式
下面我們演示一個問題妈候,這個算法就是神經(jīng)網(wǎng)絡(luò)中的誤差反向傳播
中所用到的數(shù)列的解題算法聯(lián)立遞推算法
敢靡。
示例:求以下兩個地推關(guān)系是定義的數(shù)列前3項,其中
解題:
像這樣苦银,將多個數(shù)列的遞推關(guān)系式聯(lián)合起來組成一組啸胧,稱為聯(lián)立遞推關(guān)系式
。在神經(jīng)網(wǎng)絡(luò)的世界中幔虏,所有神經(jīng)元的輸入和輸出在數(shù)學上都可以認為是用聯(lián)立遞推式聯(lián)系起來的纺念。例如,我們來看看之前文章中看過的一個神經(jīng)元的圖片
在箭頭前端標記的是權(quán)重想括,神經(jīng)元的圓圈中標記的是神經(jīng)單元的輸出變量陷谱。于是,如果以為激活函數(shù)瑟蜈,烟逊、為第3層各個神經(jīng)元的偏置,那么以下關(guān)系式成立:
根據(jù)這些關(guān)系式铺根,第3層的輸出和由第2層的輸出宪躯、、決定夷都。也就是說眷唉,第2層的輸出與第3層的輸出由聯(lián)立遞推關(guān)系式聯(lián)系起來。我們之后學的誤差反向傳播
就是將這種觀點應(yīng)用在神經(jīng)網(wǎng)絡(luò)中囤官。
為什么要將聯(lián)立遞推應(yīng)用在神經(jīng)網(wǎng)絡(luò)中呢冬阳?
其實是因為對比計算冗長的偏導關(guān)系式,計算機更加擅長計算遞推關(guān)系党饮。