【機器學(xué)習(xí)中的數(shù)學(xué)】基函數(shù)與函數(shù)空間

引言

在學(xué)習(xí)線性回歸模型的時候就會遇到基函數(shù)辞居,可能我們會遇到多項式基函數(shù)楷怒、高斯基函數(shù)、sigmoid基函數(shù)瓦灶,當(dāng)然在高等數(shù)學(xué)和信號系統(tǒng)中還經(jīng)常會碰到傅里葉基鸠删。有時候,不禁要問倚搬,這些基函數(shù)為什么這么設(shè)計冶共?這些基函數(shù)的作用是什么?
后來發(fā)現(xiàn)基函數(shù)是核方法和字典訓(xùn)練的基礎(chǔ)每界,于是乎捅僵,我逐漸有了一些例如特征轉(zhuǎn)換和映射、字典元素的概念眨层。不過還是對基函數(shù)與函數(shù)空間的關(guān)系庙楚、基函數(shù)的深層認(rèn)識模棱兩可。我希望能通過這篇文章趴樱,來探究這些東西馒闷。

基函數(shù)

在數(shù)學(xué)中,基函數(shù)是函數(shù)空間一組特殊的基的元素叁征。對于函數(shù)空間中的連續(xù)函數(shù)都可以表示成一系列基函數(shù)的線性組合纳账,就像是在向量空間中每個向量都可以表示成基向量的線性組合一樣。
在數(shù)值分析和近似理論中捺疼,基函數(shù)也稱為混合函數(shù)(blending function)疏虫,因為其在插值(interpolation)的應(yīng)用

舉例:
多項式基:{1啤呼,t, t2}是實系數(shù)二次多項式集合的基卧秘,每一個形如a+bt+ct2的二次多項式都可以寫成由基函數(shù)1、t官扣、t^2組成的線性組合翅敌。另外,{(t-1)(t-2)/2, -t(t-2), t(t-1)/2}是二次多項式的另一組基惕蹄,稱為拉格朗日基(Lagrange basis)蚯涮。
傅里葉基:余弦函數(shù)構(gòu)成了平方可積函數(shù)的(正交)Schauder基。

說說徑向基函數(shù)

徑向基函數(shù)有個類似高斯函數(shù)的形狀卖陵,我們可以看到下面的圖像恋昼,不同的系數(shù),有不同的函數(shù)圖像:



下面的三組圖像是三個徑向基函數(shù)在不同的權(quán)重的線性組合下的曲線形態(tài):




我們知道赶促,線性回歸模型可以看做是目標(biāo)函數(shù)加入了高斯噪聲模型液肌,其概率模型形式為:

<a href="http://www.codecogs.com/eqnedit.php?latex=p(t|X,\delta2)=\frac{1}{(2\pi){N/2}|K|{1/2}}exp(-\frac{1}{2}tTK^{-1}t)" target="_blank">

p(t|X,\delta^2)=\frac{1}{(2\pi)^{N/2}|K|^{1/2}}exp(-\frac{1}{2}t^TK^{-1}t)
p(t|X,\delta^2)=\frac{1}{(2\pi)^{N/2}|K|^{1/2}}exp(-\frac{1}{2}t^TK^{-1}t)
</a>
對于多維高斯模型的協(xié)方差矩陣,可以看做是數(shù)據(jù)構(gòu)成的矩陣再加入一個噪聲的方陣鸥滨,當(dāng)使用基函數(shù)的時候嗦哆,協(xié)方差矩陣就變成了核矩陣再加上噪聲的方陣谤祖。

<a href="http://www.codecogs.com/eqnedit.php?latex=K=\alpha&space;XXT&plus;\delta2I&space;\Rightarrow&space;K=\alpha&space;\Phi&space;\PhiT&space;&plus;&space;\delta2I" target="_blank">

K=\alpha XX^T+\delta^2I \Rightarrow K=\alpha \Phi \Phi^T + \delta^2I
K=\alpha XX^T+\delta^2I \Rightarrow K=\alpha \Phi \Phi^T + \delta^2I
</a>
下面是用多項式基函數(shù)和徑向基函數(shù)分別構(gòu)成的特征變換矩陣:

<a href="http://www.codecogs.com/eqnedit.php?latex=\Phi&space;=&space;\begin{bmatrix}&space;1&space;&&space;x_1&space;&&space;x_12&space;\&space;1&space;&&space;x_2&space;&&space;x_22&space;\&space;:&space;&&space;:&space;&&space;:&space;\&space;1&space;&&space;x_n&space;&&space;x_n^2&space;\end{bmatrix}" target="_blank">

\Phi = \begin{bmatrix} 1 & x_1 & x_1^2 \ 1 & x_2 & x_2^2 \ : & : & : \ 1 & x_n & x_n^2 \end{bmatrix}
\Phi = \begin{bmatrix} 1 & x_1 & x_1^2 \ 1 & x_2 & x_2^2 \ : & : & : \ 1 & x_n & x_n^2 \end{bmatrix}
</a>

<a href="http://www.codecogs.com/eqnedit.php?latex=\Phi&space;=&space;\begin{bmatrix}&space;exp(-2(x_1-1)2)&space;&&space;...&space;\&space;exp(-2(x_2-1)2)&space;&&space;...&space;\&space;:&space;&&space;:&space;\&space;exp(-2(x_n-1)^2)&space;&&space;...&space;\end{bmatrix}" target="_blank">

\Phi = \begin{bmatrix} exp(-2(x_1-1)^2) & ... \ exp(-2(x_2-1)^2) & ... \ : & : \ exp(-2(x_n-1)^2) & ... \end{bmatrix}
\Phi = \begin{bmatrix} exp(-2(x_1-1)^2) & ... \ exp(-2(x_2-1)^2) & ... \ : & : \ exp(-2(x_n-1)^2) & ... \end{bmatrix}
</a>

由于徑向基函數(shù)是一種局部基函數(shù)(localized basis function),那么距離基函數(shù)中心比較遠的區(qū)域老速,數(shù)據(jù)項對方差的貢獻將趨于零粥喜,只剩下噪聲的貢獻。因此橘券,對于基函數(shù)所在的區(qū)域之外的區(qū)域進行外插的時候额湘,模型對于它做出的預(yù)測會變得相當(dāng)確定,這不是我們想要的結(jié)果旁舰,可以用高斯過程這種貝葉斯回歸方法來避免锋华,這也就引入了徑向基核函數(shù)這種無限維的特征轉(zhuǎn)換。
下面的特征變換是由三個不同參數(shù)的徑向基函數(shù)組成的箭窜,這里看到協(xié)方差矩陣的圖像中對角線區(qū)域毯焕,藍色部分是由噪聲貢獻的,而紅色區(qū)域是由基函數(shù)貢獻的磺樱。


利用這種協(xié)方差矩陣纳猫,構(gòu)成的多維高斯分布的抽樣結(jié)果用圖形給出:

徑向基函數(shù)與插值

徑向基函數(shù)可以看作是一個高維空間中的曲面擬合(逼近)問題,學(xué)習(xí)是為了在多維空間中尋找一個能夠最佳匹配訓(xùn)練數(shù)據(jù)的曲面竹捉,然后來一批新的數(shù)據(jù)芜辕,用剛才訓(xùn)練的那個曲面來處理(比如分類、回歸)块差。徑向基函數(shù)的本質(zhì)思想是反向傳播學(xué)習(xí)算法應(yīng)用遞歸技術(shù)侵续,這種技術(shù)在統(tǒng)計學(xué)中被稱為隨機逼近。徑向基函數(shù)就是在神經(jīng)網(wǎng)絡(luò)的隱單元里提供了提供了一個函數(shù)集憾儒,該函數(shù)集在輸入模式(向量)擴展至隱空間時,為其構(gòu)建了一個任意的“基”乃沙。這個函數(shù)集中的函數(shù)就被稱為徑向基函數(shù)起趾。

徑向基函數(shù)是一種精確插值器,其方法方法不同于全局和局部多項式插值器警儒,它們都不是精確插值器(不要求表面穿過測量點)训裆。徑向基函數(shù)還可預(yù)測大于最大測量值和小于最小測量值的值。
徑向基函數(shù)用于根據(jù)大量數(shù)據(jù)點生成平滑表面蜀铲。這些函數(shù)可為平緩變化的表面生成很好的結(jié)果边琉。但在表面值在短距離內(nèi)出現(xiàn)劇烈變化和/或懷疑樣本值很可能有測量誤差或不確定性時,這些方法不適用记劝。

徑向基核函數(shù)

我們先看一下為什么說徑向基核函數(shù)(高斯核函數(shù))是無限維的特征轉(zhuǎn)換吧变姨。
將徑向基核函數(shù)做泰勒展開形式如下:

<a href="http://www.codecogs.com/eqnedit.php?latex=k(x,x')=exp(-(x-x')2)=exp(-x2)exp(-x'2)exp(2xx')&space;=exp(-x2)exp(-x'2)[\sum_{i=0}{\infty&space;}\frac{(2xx')i}{i!}]&space;=\sum_{i=0}{\infty&space;}[exp(-x2)exp(-x'2)\sqrt{\frac{2i}{i!}}\sqrt{\frac{2i}{i!}}xix'i]&space;=\Phi(x)^T\Phi(x')" target="_blank">

k(x,x')=exp(-(x-x')^2)=exp(-x^2)exp(-x'^2)exp(2xx') =exp(-x^2)exp(-x'^2)[\sum_{i=0}^{\infty }\frac{(2xx')^i}{i!}] =\sum_{i=0}^{\infty }[exp(-x^2)exp(-x'^2)\sqrt{\frac{2^i}{i!}}\sqrt{\frac{2^i}{i!}}x^ix'^i] =\Phi(x)^T\Phi(x')
k(x,x')=exp(-(x-x')^2)=exp(-x^2)exp(-x'^2)exp(2xx') =exp(-x^2)exp(-x'^2)[\sum_{i=0}^{\infty }\frac{(2xx')^i}{i!}] =\sum_{i=0}^{\infty }[exp(-x^2)exp(-x'^2)\sqrt{\frac{2^i}{i!}}\sqrt{\frac{2^i}{i!}}x^ix'^i] =\Phi(x)^T\Phi(x')
</a>
其對應(yīng)的無限維的特征轉(zhuǎn)換為:

<a href="http://www.codecogs.com/eqnedit.php?latex=\Phi(x)=exp(-x2)(1,\sqrt{\frac{2}{1!}}x,\sqrt{\frac{22}{2!}}x^2,...)" target="_blank">

\Phi(x)=exp(-x^2)(1,\sqrt{\frac{2}{1!}}x,\sqrt{\frac{2^2}{2!}}x^2,...)
\Phi(x)=exp(-x^2)(1,\sqrt{\frac{2}{1!}}x,\sqrt{\frac{2^2}{2!}}x^2,...)
</a>

我們看到了徑向基核函數(shù),是xi和xj數(shù)據(jù)之間歐氏距離的函數(shù)厌丑。
下面是核矩陣和抽樣的圖像:




從上圖看到定欧,徑向基核函數(shù)以每個數(shù)據(jù)點為中心進行建模渔呵,在有數(shù)據(jù)的區(qū)域貢獻隨機變量的方差,而不再像用單一的徑向基函數(shù)只在函數(shù)中心保有對方差的貢獻砍鸠。上圖同樣說明扩氢,相鄰的數(shù)據(jù)有強相關(guān)性,而相離的數(shù)據(jù)沒有什么相關(guān)性爷辱,即紅色區(qū)域和藍色區(qū)域說明的情況录豺。
這是高斯過程模型的基礎(chǔ),相比貝葉斯線性模型而言饭弓,高斯過程不再對模型參數(shù)進行建模(通過對參數(shù)分布進行采樣双饥,再進行不同基函數(shù)模型的組合),而是直接對數(shù)據(jù)進行相應(yīng)操作示启。

函數(shù)空間淺顯解釋

空間是數(shù)學(xué)抽象出來描述具有某些特殊性質(zhì)和結(jié)構(gòu)的集合兢哭。學(xué)過線性代數(shù)的人都知道線性空間,向量是線性空間的基本元素夫嗓〕俾荩空間中還有一個很重要的概念是基。為什么要有基舍咖?是為了更好的描述空間矩父。比如說三維空間,這個空間里面的元素的個數(shù)是不可數(shù)的(也就是和自然數(shù)集找不到一一對應(yīng)的關(guān)系)排霉,所以一一列出來是不可能的窍株。數(shù)學(xué)家想出了一個很好的辦法,用任意三個不共面向量的線性組合來表示這個空間中的任意一個元素攻柠。
有了上面的概念球订,我們可以理解函數(shù)空間就是滿足一定性質(zhì)和結(jié)構(gòu)的函數(shù)集合,組成這個空間的元素都是滿足一定條件的函數(shù)瑰钮。所以冒滩,這個函數(shù)空間里面的所有元素都是函數(shù),而且這個空間其實是無窮維的浪谴,基有無窮多個开睡。
因為我是通信專業(yè)的,現(xiàn)在用傅里葉變換來理解一下函數(shù)空間苟耻。傅里葉變換就是給出了一組基篇恒,要求求出利用每個基線性組合成這一信號(函數(shù))的組合系數(shù),或者說是在這組基下的坐標(biāo)凶杖。傅里葉變換的美妙之處就在于這組基取得實在是太好了胁艰。為什么呢?首先他們是正交的,更主要的是它還和自然界的情況有著微妙的聯(lián)系蝗茁。自然界中的水波醋虏、音波、電磁波等等哮翘,如果用數(shù)學(xué)抽象颈嚼,顯然是三角函數(shù)。在振蕩電路饭寺、模擬通信等等領(lǐng)域中阻课,使用三角函數(shù)形式的波形的好處也是非常多的〖璩祝可以看到限煞,傅里葉變換在一維信號處理領(lǐng)域獲得了很大的成功。需要指出的是员凝,傅里葉變換在二維信號處理領(lǐng)域署驻,比如說在圖像處理領(lǐng)域的缺點就很多了。直觀上健霹,圖像的周期現(xiàn)象似乎不是那么明顯旺上。而且從一維情況轉(zhuǎn)換到二維情況,復(fù)雜度成倍增加糖埋。

轉(zhuǎn)載請注明作者Jason Ding及其出處
Github博客主頁(http://jasonding1354.github.io/)
GitCafe博客主頁(http://jasonding1354.gitcafe.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.reibang.com/users/2bd9b48f6ea8/latest_articles)
Google搜索jasonding1354進入我的博客主頁

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末宣吱,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子瞳别,更是在濱河造成了極大的恐慌征候,老刑警劉巖,帶你破解...
    沈念sama閱讀 223,002評論 6 519
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件祟敛,死亡現(xiàn)場離奇詭異疤坝,居然都是意外死亡,警方通過查閱死者的電腦和手機馆铁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,357評論 3 400
  • 文/潘曉璐 我一進店門跑揉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人叼架,你說我怎么就攤上這事畔裕∫虑耍” “怎么了乖订?”我有些...
    開封第一講書人閱讀 169,787評論 0 365
  • 文/不壞的土叔 我叫張陵,是天一觀的道長具练。 經(jīng)常有香客問我乍构,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,237評論 1 300
  • 正文 為了忘掉前任哥遮,我火速辦了婚禮岂丘,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘眠饮。我一直安慰自己奥帘,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 69,237評論 6 398
  • 文/花漫 我一把揭開白布仪召。 她就那樣靜靜地躺著寨蹋,像睡著了一般。 火紅的嫁衣襯著肌膚如雪扔茅。 梳的紋絲不亂的頭發(fā)上已旧,一...
    開封第一講書人閱讀 52,821評論 1 314
  • 那天,我揣著相機與錄音召娜,去河邊找鬼运褪。 笑死,一個胖子當(dāng)著我的面吹牛玖瘸,可吹牛的內(nèi)容都是我干的秸讹。 我是一名探鬼主播,決...
    沈念sama閱讀 41,236評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼店读,長吁一口氣:“原來是場噩夢啊……” “哼嗦枢!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起屯断,我...
    開封第一講書人閱讀 40,196評論 0 277
  • 序言:老撾萬榮一對情侶失蹤文虏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后殖演,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體氧秘,經(jīng)...
    沈念sama閱讀 46,716評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,794評論 3 343
  • 正文 我和宋清朗相戀三年趴久,在試婚紗的時候發(fā)現(xiàn)自己被綠了丸相。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,928評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡彼棍,死狀恐怖灭忠,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情座硕,我是刑警寧澤弛作,帶...
    沈念sama閱讀 36,583評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站华匾,受9級特大地震影響映琳,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,264評論 3 336
  • 文/蒙蒙 一萨西、第九天 我趴在偏房一處隱蔽的房頂上張望有鹿。 院中可真熱鬧,春花似錦谎脯、人聲如沸葱跋。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,755評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽年局。三九已至,卻和暖如春咸产,著一層夾襖步出監(jiān)牢的瞬間矢否,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,869評論 1 274
  • 我被黑心中介騙來泰國打工脑溢, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留僵朗,地道東北人。 一個月前我還...
    沈念sama閱讀 49,378評論 3 379
  • 正文 我出身青樓屑彻,卻偏偏與公主長得像验庙,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子社牲,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,937評論 2 361

推薦閱讀更多精彩內(nèi)容