原講解視頻地址鬼譬,本篇是對(duì)該視頻的筆記细层。感謝視頻UP的講解墩划,受益頗多蜂桶!
如果我們只知道一個(gè)模型是怎么做的寝姿,卻不知道它為何這樣做交排,對(duì)于我們做科研的人來(lái)說(shuō)是遠(yuǎn)遠(yuǎn)不夠的。我們必須知其然并且知其所以然饵筑,才能夠在現(xiàn)有的模型基礎(chǔ)上提出自己的想法和改進(jìn)埃篓。
目錄?1.GCN基礎(chǔ) 2.譜圖理論 3.傅里葉變換 4.GCN
1.GCN基礎(chǔ)
1.1 同樣都是“圖”,Graph與Image有什么聯(lián)系與區(qū)別呢根资?
Image是Graph在歐式空間中的一種特例架专。Graph是相較于Image來(lái)說(shuō)更加廣義的一種拓?fù)浣Y(jié)構(gòu)。Graph由點(diǎn)和邊組成它可以表示任意的事物與事物之間的關(guān)系玄帕。而Image是表示在歐式空間中的事物與事物之間的關(guān)系部脚。我們可以根據(jù)Image來(lái)構(gòu)建對(duì)應(yīng)的Graph,將每一個(gè)像素作為節(jié)點(diǎn)桨仿,像素之間的關(guān)系作為邊睛低。
現(xiàn)實(shí)生活中能夠建圖的場(chǎng)景非常之多,社交關(guān)系服傍,詞匯搜索等等钱雷。
1.2 什么是圖神經(jīng)網(wǎng)絡(luò)?
圖神經(jīng)網(wǎng)絡(luò)就是專(zhuān)門(mén)用來(lái)處理圖數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)架構(gòu)吹零。具體來(lái)說(shuō)罩抗,會(huì)給定圖的每個(gè)鄰接矩陣和節(jié)點(diǎn)特征,通過(guò)將這兩個(gè)輸入進(jìn)行某種圖上的映射灿椅。從而得到每個(gè)節(jié)點(diǎn)下一層的特征套蒂。
圖神經(jīng)網(wǎng)絡(luò)的聚合模式:
合理性:比如社交網(wǎng)絡(luò)中我們想要獲得某一個(gè)用戶的特征钞支,可以搜集與他相近的人的特征,他們會(huì)具有一定的相關(guān)性操刀。(近朱者赤烁挟,近墨者黑)
許多GNN相關(guān)的模型其實(shí)都是在設(shè)計(jì)函數(shù)“f”
1.3 GCN模型?
這里我們只討論簡(jiǎn)單無(wú)向圖(圖無(wú)自環(huán)骨坑、無(wú)重邊撼嗓,邊無(wú)方向)
公式中的是鄰接矩陣+單位矩陣,相當(dāng)于給每一個(gè)節(jié)點(diǎn)添加一個(gè)自環(huán)欢唾。是對(duì)角陣+單位陣且警。表示添加自環(huán)后每一個(gè)節(jié)點(diǎn)的度值。代表了每一個(gè)節(jié)點(diǎn)的度的值礁遣。對(duì)于對(duì)角陣求冪斑芜,只要對(duì)對(duì)角線上的每一個(gè)元素求冪即可。
例:
是可訓(xùn)練的參數(shù)祟霍,是對(duì)輸入的feature進(jìn)行線性變換杏头。是非線性的激活函數(shù)。
簡(jiǎn)單理解GCN在做什么:對(duì)圖的鄰接矩陣加了一個(gè)自環(huán)沸呐,做了對(duì)稱(chēng)歸一化大州。然后用得到的結(jié)果對(duì)輸入的特征進(jìn)行聚合。每個(gè)節(jié)點(diǎn)都聚合到了自己和周邊節(jié)點(diǎn)加權(quán)求和的feature信息垂谢。
2. 譜圖理論
2.1 什么是譜圖理論?
研究與圖的鄰接矩陣相關(guān)的一些性質(zhì)的領(lǐng)域疮茄。將線性代數(shù)研究矩陣性質(zhì)限定在了研究圖的鄰接矩陣的范圍內(nèi)滥朱。譜圖理論是線性代數(shù)的子領(lǐng)域。
2.2 回顧:線性代數(shù)相關(guān)知識(shí)
(1)特征值與特征向量
對(duì)于一個(gè)矩陣力试,如果有其中為標(biāo)量徙邻、。就稱(chēng)是的特征向量畸裳,是A的特征值缰犁。
(2)定理
如果一個(gè)矩陣是一個(gè)實(shí)對(duì)稱(chēng)陣,那么它一定有N個(gè)特征值怖糊,對(duì)應(yīng)著N個(gè)互相正交的特征向量帅容。
,其中伍伤,除了對(duì)角線上以外其他元素都是0并徘。對(duì)角線上的元素都是一個(gè)特征值。
(3)半正定矩陣
半正定矩陣就是所有的特征值都大于等于0扰魂。
(4)二次型
給定一個(gè)矩陣A麦乞,左乘x轉(zhuǎn)置蕴茴,右乘x。就稱(chēng)為向量x對(duì)矩陣A的二次型姐直。
(5)瑞利熵
瑞利熵就是一個(gè)向量關(guān)于矩陣A的二次型與這個(gè)向量關(guān)于單位矩陣的二次型的比值倦淀。
為什么需要研究瑞利熵:因?yàn)槠渑c矩陣的特征值有著密切的聯(lián)系。如我們假定是矩陣A的一個(gè)特征向量声畏,那么瑞利熵就是矩陣對(duì)應(yīng)的特征值撞叽。
證明如下:
因此瑞利熵是我們研究特征值的重要手段。
2.3 譜圖理論基礎(chǔ)
(1)與(重要)
是圖的拉普拉斯矩陣砰识,能扒。
是拉普拉斯矩陣的對(duì)稱(chēng)規(guī)范化,辫狼。
與都是實(shí)對(duì)稱(chēng)陣初斑。因此他們都有N個(gè)特征值和N個(gè)互相正交的特征向量∨虼Γ可以分解為上述的的形式见秤。且這兩個(gè)矩陣都是半正定的,其特征值都是大于等于0的真椿。
證明:(通過(guò)瑞利熵)
如果我們能夠證明對(duì)于任何的一個(gè)向量都有鹃答,那么當(dāng)是特征向量,也即當(dāng)L是特征值是也成立突硝。
首先测摔,分母部分肯定是恒大于等于0的,因?yàn)樗窍蛄縳的模長(zhǎng)的形式解恰。所以我們只需要證明分子恒大于0即可锋八。
我們定義,它只有在第i行的第i列和第j行的第j列才為1护盈,在第i行的第j列與第j行的第i列都是-1挟纱,其他位置都是0。
為什么構(gòu)造腐宋,因?yàn)樗亩涡头浅S刑攸c(diǎn)紊服,對(duì)于向量x,關(guān)于的二次型為:
所以非常有特點(diǎn)胸竞,它的二次型就相當(dāng)于對(duì)x的第i個(gè)點(diǎn)和第j個(gè)點(diǎn)的坐標(biāo)位置做差求平方欺嗤。
拉普拉斯矩陣,因此L的二次型為:
也就是將上式中的與換成了規(guī)范化后的與。
一個(gè)更加強(qiáng)的性質(zhì):不僅而且卫枝。
證明:(與上述證明類(lèi)似)
我們定義剂府,它在第i行的第i列和第j行的第j列,第i行的第j列和第j行的第i列都為1剃盾,其他位置為0腺占。
可得的二次型:淤袜。
定義。
可得的二次型:衰伯。
同理铡羡,定義。
可得的二次型:
由
可得
由上述證明我們得出的瑞利熵是的意鲸。因此的特征值也是恒的烦周。
3. 傅里葉變換
傅里葉變換其實(shí)就是“去研究同一個(gè)事物在不同的域之間不同的視角”是怎樣的,以及在不同的域之間進(jìn)行變換怎顾。