【論文筆記】Graph Transformer Networks

原文摘自我自己的博客Link:http://holdenhu.cn/2020/paper-notegraph-transformer-networks/

題目:《Graph Transformer Network》

作者:Seongjun Yun

來源:NeurIPS2019

源碼:Not published yet

筆記:Hu Hengchang

Intro


GTNs(Graph Transformer Networks)的主要功能是在原始圖上識別未連接節(jié)點之間的有用連接冲杀。

Transformer來學(xué)習(xí)有用的多跳連接,即所謂的元路徑煤蚌。將異質(zhì)輸入圖轉(zhuǎn)換為每個任務(wù)有用的元路徑圖异逐,并以端到端方式學(xué)習(xí)圖上的節(jié)點表示。

Definition


heterogeneous

異質(zhì)圖:例如银萍,引用網(wǎng)絡(luò)具有多種類型的節(jié)點(例作者络凿、論文憨攒、會議)和由它們之間的關(guān)系(如作者-論文觉既、論文-會議)定義的邊惧盹。

homogeneous

同質(zhì)圖,具有一種類型的節(jié)點和邊的標(biāo)準(zhǔn)圖瞪讼。

Related Work


傳統(tǒng)的GNN

是一種兩階段的方法钧椰,但每個問題都需要手工構(gòu)建元路徑。這些元路徑的選擇對下游分析的準(zhǔn)確性有很大的影響符欠。

包括spectral和non-spectral兩種方法嫡霞。

  • spectral是基于spectral domain(using Fourier basis)上進行卷積。

  • non-spectral直接在圖上沿著edge執(zhí)行卷積操作背亥。

Contribution


大多數(shù)現(xiàn)有的GNNs都被設(shè)計為在固定(fix)和同質(zhì)(homogeneous)的圖上學(xué)習(xí)節(jié)點表示。當(dāng)在不確定的圖或由各種類型的節(jié)點和邊組成的異質(zhì)(heterogeneous)圖上學(xué)習(xí)表示時悬赏,這些限制尤其成問題狡汉。一般的GNN手動定義元路徑,但GTNs可以學(xué)習(xí)有效的元路徑闽颇。

因此GTNs的出現(xiàn):

  1. 提出了一種新的圖變換網(wǎng)絡(luò)盾戴,識別有用的元路徑和多跳連接來學(xué)習(xí)圖上的有效節(jié)點表示。

  2. 圖的生成是可解釋的兵多,提供有效路徑連接的解釋尖啡。

  3. 證明了圖變換網(wǎng)絡(luò)學(xué)習(xí)的節(jié)點表示的有效性橄仆,從而獲得了最佳的性能,而現(xiàn)有的方法在異質(zhì)圖的所有三種基準(zhǔn)節(jié)點分類中都使用了領(lǐng)域知識衅斩。

Implemention


我們的GTNs的目標(biāo)是生成新的圖結(jié)構(gòu)盆顾,同時學(xué)習(xí)到有效的node representation。GTNs使用多個candidate adjacency matrices尋找新的圖結(jié)構(gòu)畏梆。

preliminaries

  • 圖表示為G=(V,E), V is set of nodes, E is set of observed edges您宪。

  • \mathcal{T}^v\mathcal{T}^e分別表示node的種類,和edge的種類的set奠涌。

  • 異質(zhì)圖能表示為adjacency matrices的集合 {A_k}_{k=1}^K, 其中K=|\mathcal{T}^e|, 它也可以寫成Tensor \mathbb{A} \in \mathbf{R}^{N \times N \times K}

Meta-path Generation

meta-path
  1. 此圖即表示GT(Graph Transformer) Layer宪巨,它先從tensor \mathbb{A}(每一片就是一種edge type)中用權(quán)重選擇adjacency matrices(即edge type)。權(quán)重選擇的方式也可以理解成卷積溜畅,卷積后的兩個matrices分別是兩個圖解構(gòu)捏卓,表示為Q_1Q_2

  2. 選擇matrices的兩個卷積核是用softmax計算得出的(比如圖中例子慈格,一個卷積核說取最前面的matrices怠晴,一個卷積核說取最后面那個matrices),但實際上是帶有權(quán)重分配的峦椰。

  3. 然后再將兩個matrices組成新的圖結(jié)構(gòu)(即兩個鄰接矩陣的矩陣乘法龄寞,{Q_1}{Q_2})。

用數(shù)學(xué)形式可以表示為:

  • 選擇的Q可以表示為:

Q=F\left(\mathbb{A} ; W_{\phi}\right)=\phi\left(\mathbb{A} ; \operatorname{softmax}\left(W_{\phi}\right)\right)

即得出的Q是將\mathbb{A}和權(quán)重參數(shù)W_{\phi}送去convolution layer卷積得到的

  • 每一個Q_i可以表示成:
    \sum_{t_{l} \in \mathcal{T}^{e}} \alpha_{t_{l}}^{(l)} A_{t_{l}}

其中\mathcal{T}^e是edge的類型集合汤功,\alpha_{t_{l}}^{(l)}是edge第l種類型t_l在第l層的權(quán)重物邑。

以圖中為例:\mathcal{T}^e有4個{t_1,t_2,t_3,t_4}, 即對應(yīng)4層matrices: {A_1,A_2,A_3,A_4},W_{\phi}={α_1,α_2,α_3,α_4}

  • 如果不是分兩個Q滔金,而是多個色解,則最后得到的結(jié)果新A可表示為:

A_P = \left(\sum_{t_{1} \in \mathcal{T}^{e}} \alpha_{t_{1}}^{(1)} A_{t_{1}}\right)\left(\sum_{t_{2} \in \mathcal{T}^{e}} \alpha_{t_{2}}^{(2)} A_{t_{2}}\right)...\left(\sum_{t_{l} \in \mathcal{T}^{e}} \alpha_{t_{l}}^{(l)} A_{t_{l}}\right)

Multi-channel

為了同時生成多種類型的元路徑,圖1中1×1卷積的輸出通道設(shè)置為C餐茵。

multi-meta-path

然后科阎,GT層產(chǎn)生一組meta-path,中間鄰接矩陣Q1和Q2成為鄰接張量\mathbb{Q}_1\mathbb{Q}_2 \in \mathbf{R}^{N \times N \times C}忿族,如圖2所示锣笨。通過多個不同的圖結(jié)構(gòu)學(xué)習(xí)不同的節(jié)點表示是有益的。在l個GT層堆棧之后道批,將GCN應(yīng)用于元路徑張量\mathbb{A}^{l} \in \mathbf{R}^{N \times N \times C}的每個通道错英,并將多個節(jié)點的representation拼接起來。

結(jié)果Z的生成可表示為:

Z=\|\|_{i=1}^{C} \sigma\left(\tilde{D}_{i}^{-1} \tilde{A}_{i}^{(l)} X W\right)

其中||是concatenation操作隆豹。C表示channel數(shù)量椭岩。 \tilde{A_{i}^{l}}=A_{i}^{l}+I, 表示張量\mathbb{A}^{(l)}的第l個通道。\tilde{D_i}\tilde{\mathbb{A}_i}的degree matrix,W \in \mathbf{R}^{d \times d} 是訓(xùn)練權(quán)重矩陣判哥,X \in \mathbf{R}^{N \times d}表示特征矩陣献雅。

Evaluation


研究問題:

  • Q1:GTN生成的新圖結(jié)構(gòu)對學(xué)習(xí)node representation是否有效?

  • Q2:GTN能否根據(jù)數(shù)據(jù)集自適應(yīng)地產(chǎn)生可變長度的元路徑塌计?

  • Q3:如何從GTNs生成的鄰接矩陣來解釋每個元路徑的重要性挺身?

Dataset

dataset

GTN和其他節(jié)點分類基線的性能

baseline

可以看到GTNs獲得最高性能。

可解釋元路徑

explain

Note: 這里的不同字母表示不同種類的node.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末夺荒,一起剝皮案震驚了整個濱河市瞒渠,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌技扼,老刑警劉巖伍玖,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異剿吻,居然都是意外死亡窍箍,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進店門丽旅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來椰棘,“玉大人,你說我怎么就攤上這事榄笙⌒澳” “怎么了?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵茅撞,是天一觀的道長帆卓。 經(jīng)常有香客問我,道長米丘,這世上最難降的妖魔是什么剑令? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮拄查,結(jié)果婚禮上吁津,老公的妹妹穿的比我還像新娘。我一直安慰自己堕扶,他們只是感情好碍脏,可當(dāng)我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著稍算,像睡著了一般典尾。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上邪蛔,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天急黎,我揣著相機與錄音,去河邊找鬼侧到。 笑死勃教,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的匠抗。 我是一名探鬼主播故源,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼汞贸!你這毒婦竟也來了绳军?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤矢腻,失蹤者是張志新(化名)和其女友劉穎门驾,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體多柑,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡奶是,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了竣灌。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片聂沙。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖初嘹,靈堂內(nèi)的尸體忽然破棺而出及汉,到底是詐尸還是另有隱情,我是刑警寧澤屯烦,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布坷随,位于F島的核電站,受9級特大地震影響漫贞,放射性物質(zhì)發(fā)生泄漏甸箱。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一迅脐、第九天 我趴在偏房一處隱蔽的房頂上張望芍殖。 院中可真熱鬧,春花似錦谴蔑、人聲如沸豌骏。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽窃躲。三九已至,卻和暖如春钦睡,著一層夾襖步出監(jiān)牢的瞬間蒂窒,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留洒琢,地道東北人秧秉。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像衰抑,于是被迫代替她去往敵國和親象迎。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容