使用圖卷積網(wǎng)絡(luò)對關(guān)系數(shù)據(jù)進行建模

論文:Modeling Relational Data with Graph Convolutional Networks 使用圖卷積網(wǎng)絡(luò)對關(guān)系數(shù)據(jù)進行建模

論文鏈接:https://arxiv.org/abs/1703.06103

Github鏈接:https://github.com/tkipf/relational-gcn


此論文引入了關(guān)系圖卷積網(wǎng)絡(luò)(R-GCNs),并在兩個標準知識庫上應(yīng)用R-GCNs梢莽,完成了兩個任務(wù)——

  • 鏈接預(yù)測
  • 實體分類

那么是應(yīng)用這個網(wǎng)絡(luò)并解決它的呢明吩?我們可以把知識庫想象成一個有向有標簽的多圖饭宾,我個人理解就是有向帶權(quán)圖晤锥。

知識庫

我們上面提到的兩個任務(wù)新博,其實可以看成兩個解決問題時的situations吼渡,在這種情況下蛤肌,many丟失的信息都may存在于鄰域結(jié)構(gòu)編碼的圖中业簿。我們來For instance瘤礁,

  • 知道Steven在VTU上學接受教育。

那么就表示Steven應(yīng)該帶有一個標簽person, 而且三人組(Steven HD, lived in, China)就must屬于知識圖梅尤。

So柜思,我們需要為關(guān)系圖中的實體開發(fā)一個編碼器模型,從而可以應(yīng)用于兩個situations巷燥。

對于鏈路預(yù)測任務(wù)赡盘,可以看成是一個自編碼器,這個自編碼器包括2個part缰揪。

  • 編碼器:一個生成實體的陨享,隱含特征,表示的R-GCN
  • 解碼器:一個,利用這些表示抛姑,來預(yù)測標記邊赞厕,的張量因子分解模型。

其實解碼器可以rely on任何類型的因子分解(也就是任何評分函數(shù))定硝,但是論文中使用的方法是DisMult皿桑。

一、論文的亮點

1.1 展示了GCN框架可以應(yīng)用于關(guān)系數(shù)據(jù)建模喷斋,i.e.鏈接預(yù)測和實體分類任務(wù)唁毒。
1.2 引入了參數(shù)共享實現(xiàn)稀疏約束的技術(shù),技術(shù)實現(xiàn)的目的是將其apply到具有大量關(guān)系的多圖星爪。
1.3 為了improve模型的性能浆西,以DisMult為例,使用一個在關(guān)系圖中執(zhí)行多步信息傳播的編碼器模型來加強因子分解模型顽腾。

二近零、Neural relational modeling

2.1 模型中符號的定義

2.2 關(guān)系圖卷積網(wǎng)絡(luò)R-GCN

R-GCN是GCN在大規(guī)模關(guān)系數(shù)據(jù)上的一種擴展,這個GCN是在局部鄰居信息進行聚合的GCN抄肖。這些方法我們可以理解為一個簡單可微的消息傳遞模型的一個special example久信。

消息傳遞模型

模型解釋

上述(1)的轉(zhuǎn)換模型在局部有結(jié)構(gòu)的鄰居中聚集,編碼特征是非常有效的漓摩。
同時裙士,在圖分類、基于圖的半監(jiān)督節(jié)點分類等任務(wù)中管毙,可以大幅度地提高其性能腿椎。

基于此,論文定義了一個簡單的傳播模型夭咬,這個model可以用來計算在一個關(guān)系多圖中的節(jié)點或?qū)嶓w的前向更新啃炸。

論文新定義的傳播模型

傳播模型的解釋

2.3 R-GCN和GCN不同的地方

論文中,和GCN不同的是卓舵,文中引入了一個relation-specific的轉(zhuǎn)換南用,也就是依賴于邊的類型和方向
除了采取簡單的線性消息轉(zhuǎn)換外掏湾,還可以選擇多層神經(jīng)網(wǎng)絡(luò)裹虫,它的靈活性更高,但是計算效率很低忘巧。

R-GCN模型對圖中的節(jié)點或?qū)嶓w(紅色)進行計算更新隱含表示的示意圖

上圖中恒界,需要注意的幾點:

  • 對每個節(jié)點引入了一個特殊的關(guān)系類型:自連接,self-loop
  • 深藍色的方塊表示來自于鄰居節(jié)點激活的特征(D維向量)
  • in 和 out 表示兩種類型的邊
  • each節(jié)點的更新可以用整個圖中的共享參數(shù)并行計算砚嘴。

2.4 Regularization 正則化or規(guī)則化

論文中新定義的傳播模型(公式2)十酣,當它應(yīng)用于多關(guān)系數(shù)據(jù)的一個問題時涩拙,圖中關(guān)系的數(shù)量隨著參數(shù)的增長而增長,從而會導致overfit的問題耸采。

為了解決overfit的問題兴泥,我們需要引入2個獨立的方法對R-GCN層進行規(guī)則化——

  • 基函數(shù)分解
  • 塊對角分解

這兩種分解方法都可以減少關(guān)系比較多的數(shù)據(jù),i.e.虾宇,知識庫搓彻,在train中需要learning的參數(shù)。從而減少overfit的問題嘱朽。

2.4.1 basis decomposition 基函數(shù)分解
基函數(shù)分解模型
基函數(shù)分解模型的解釋
2.4.2 block-diagonal decomposition 塊對角分解
塊對角分解模型

塊對角分解模型的解釋

論文中旭贬,對所有的R-GCN模型都采取下面的形式:

  • 按傳播模型(公式2)堆疊L層;
  • 輸入層中的每個節(jié)點搪泳,如果沒有其他的特征稀轨,就選擇一個one-hot向量作為輸入特征
  • 對于塊分解岸军,用一個簡單的線性變換把上句的one-hot向量映射到一個稠密的表示奋刽。

三、鏈接預(yù)測

看到了鏈接預(yù)測艰赞,我們首先要問佣谐,

  • 預(yù)測的是什么?根據(jù)什么預(yù)測的方妖?為了做什么任務(wù)狭魂?

預(yù)測的是新的元組(subject, relation, object)
根據(jù)什么預(yù)測的,暫時還不知道党觅。
任務(wù)是為可能的邊(s, r, o)分配一個分數(shù)f(s, r, o)趁蕊,從而確定這些邊屬于邊集的可能性。

當然仔役,做這個任務(wù),還需要一個大殺器——圖形自動編碼器是己,

  • 這個玩意兒是用什么組成的又兵?

一個實體編碼器+評分函數(shù)(解碼器)

這個圖形自動編碼器的作用,就是把每個實體映射到一個真值向量上卒废。
接下來沛厨,解碼器會根據(jù)節(jié)點表示重建圖的邊
也就是說摔认,編碼器對三元組(subject, relation, object)進行評分逆皮。

文中使用的方法是——使用一個R-GCN編碼器,通過計算節(jié)點來表示参袱。

論文中的實驗电谣,進行評分的就是選擇了一個評分函數(shù)秽梅,評分函數(shù)就是DisMult,每個關(guān)系r都跟一個對角矩陣R有關(guān):

評分函數(shù)

訓練模型的負采樣方式

負采樣方法的解釋
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末剿牺,一起剝皮案震驚了整個濱河市企垦,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌晒来,老刑警劉巖钞诡,帶你破解...
    沈念sama閱讀 216,591評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異湃崩,居然都是意外死亡荧降,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評論 3 392
  • 文/潘曉璐 我一進店門攒读,熙熙樓的掌柜王于貴愁眉苦臉地迎上來朵诫,“玉大人,你說我怎么就攤上這事整陌∞智裕” “怎么了?”我有些...
    開封第一講書人閱讀 162,823評論 0 353
  • 文/不壞的土叔 我叫張陵泌辫,是天一觀的道長随夸。 經(jīng)常有香客問我,道長震放,這世上最難降的妖魔是什么宾毒? 我笑而不...
    開封第一講書人閱讀 58,204評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮殿遂,結(jié)果婚禮上诈铛,老公的妹妹穿的比我還像新娘。我一直安慰自己墨礁,他們只是感情好幢竹,可當我...
    茶點故事閱讀 67,228評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著恩静,像睡著了一般焕毫。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上驶乾,一...
    開封第一講書人閱讀 51,190評論 1 299
  • 那天邑飒,我揣著相機與錄音,去河邊找鬼级乐。 笑死疙咸,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的风科。 我是一名探鬼主播撒轮,決...
    沈念sama閱讀 40,078評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼乞旦,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了腔召?” 一聲冷哼從身側(cè)響起杆查,我...
    開封第一講書人閱讀 38,923評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎臀蛛,沒想到半個月后亲桦,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,334評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡浊仆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,550評論 2 333
  • 正文 我和宋清朗相戀三年客峭,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片抡柿。...
    茶點故事閱讀 39,727評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡舔琅,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出洲劣,到底是詐尸還是另有隱情备蚓,我是刑警寧澤,帶...
    沈念sama閱讀 35,428評論 5 343
  • 正文 年R本政府宣布囱稽,位于F島的核電站郊尝,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏战惊。R本人自食惡果不足惜流昏,卻給世界環(huán)境...
    茶點故事閱讀 41,022評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望吞获。 院中可真熱鬧况凉,春花似錦、人聲如沸各拷。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽烤黍。三九已至膛锭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蚊荣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評論 1 269
  • 我被黑心中介騙來泰國打工莫杈, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留互例,地道東北人。 一個月前我還...
    沈念sama閱讀 47,734評論 2 368
  • 正文 我出身青樓筝闹,卻偏偏與公主長得像媳叨,于是被迫代替她去往敵國和親腥光。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,619評論 2 354

推薦閱讀更多精彩內(nèi)容