RGCNs-paper

一阔加、摘要

SRL主要關(guān)注預(yù)測知識圖譜丟失的信息颅围,知識圖譜儲存三元組(subject,predicate,object)。eg鼓蜒。(Mikhail Baryshnikov,educated_at,Vaganova Academy)坝橡,Baryshnikov和Vaganova Academy)是實體泻帮,educated_at是關(guān)系,實體標(biāo)注類型驳庭,Vaganova Academy標(biāo)簽是university刑顺。


關(guān)系.jpg

知識圖譜有廣泛的應(yīng)用前景氯窍,比如問答系統(tǒng)饲常、信息檢索。這篇文章我們介紹R-GCNs,解決知識圖譜兩大經(jīng)典任務(wù):實體識別狼讨、鏈路預(yù)測贝淤,實體識別恢復(fù)丟失三元組,鏈路預(yù)測將實體進行分類政供,處理實際生活中多關(guān)系數(shù)據(jù)播聪。接下來朽基,我們將完整展示應(yīng)用R-GCNs完成實體識別,使用softmax分類node离陶,優(yōu)化cross-entropy損失得到參數(shù)稼虎。鏈路預(yù)測類比autoencoder,(1)encoder,R-GCNs生成實體特征表示招刨,(2)decoder霎俩,tensor factorization model用這些特征預(yù)測帶上標(biāo)簽的edge。原則decoder可以使用任何factorization或得到score模型沉眶,我們使用最簡單有效的模型DistMult打却,DistMult豐富encode,加速關(guān)系圖推斷過程谎倔,在FB15K-237提升了29.8%柳击。

我們主要的貢獻有:(1)首次展示GCN可以預(yù)測關(guān)系數(shù)據(jù),(2介紹參數(shù)共享的技術(shù)片习,在多關(guān)系中處理sparsity constraints,(3)DistMult可以豐富encoder表現(xiàn)捌肴,主要關(guān)系圖中多步驟處理information propagation

二、模型原理

定義多關(guān)系圖G=(V,\varepsilon,R)毯侦,v_i \in V表示哭靖,node(entities),(v_i,r,v_j)表示labeled edges關(guān)系,r\in R是關(guān)系類型侈离。

RGCNS.jpg

1. Relational graph convolutional networks

我們的模型靈感來源于GCNs试幽,GCNs處理圖鄰居,這些圖神經(jīng)網(wǎng)絡(luò)和消息傳遞框架不同卦碾。

h_i^{(l+1)}=\sigma(\sum_{m\in M_i}g_m(h_i^{(l)},h_j^{(l)}),\quad (1)

h_i^{(l)} \in R^{d^{(l)}}節(jié)點v_i在l-th layer的隱藏狀態(tài)铺坞,g_m(.,.)傳遞給element-wise激活方法\sigma(.),比如ReLU(.)=max(0,.)^2M_i表示節(jié)點v_i進來的消息洲胖,類比于incoming edge集合济榨,g_m(.,.)消息處理神經(jīng)網(wǎng)絡(luò)或者簡單的線性轉(zhuǎn)換g_m(h_i,h_j)=Wh_j,這些類型的轉(zhuǎn)換在聚合編碼結(jié)構(gòu)化鄰居特征非常有效绿映,特別是圖分類擒滑。受這些啟發(fā),我們定義了以下propagation model計算向前更新實體v_i

h_i^{(l+1)}=\sigma(\sum_{r\in R}\sum_{j \in N_i^r} \frac{1}{c_{i,r}}W_r^{(l)}h_j^{(l)}+W_0^{(l)}W_i^{(l)}), \quad (2)

N_i^r表示node i的在關(guān)系r \in R鄰居indices叉弦,c_{i,r}是problem-specifi歸一化約束丐一,可以使用c_{i,r}=|N_i^r|

等式(2)用sum轉(zhuǎn)換鄰居特征向量淹冰,與常規(guī)的GCNs不同库车,我們介紹基于關(guān)系的轉(zhuǎn)換,這些關(guān)系依賴邊的類型和方向樱拴。為了確保在l+1節(jié)點依賴l層柠衍,每個節(jié)點加特殊關(guān)系self-connection洋满。除了簡單的線性消息傳遞,也可以更加靈活的方法珍坊,比如多層神經(jīng)網(wǎng)絡(luò)牺勾,當(dāng)然這也會提高計算代價。

2.Regularization

等式(2)隨著圖中關(guān)系增加阵漏,參數(shù)個數(shù)也急速增加禽最。在關(guān)系比較少見或圖非常大會過渡擬合,為了解決這個問題袱饭,我們介紹兩種方法川无,regularing R-GCNs權(quán)重:basis和block-diagonal-decomposition。在basis decomposition

W_r^{(l)} = \sum_{b=1}^B a_{rb}^{(l)}V_b^{(l)},\quad (3)

i.e.是線性轉(zhuǎn)化虑乖,V_b^{(l)} \in R^{d^{(l+1)}*d^{(l)}}a_{rb}^{(l)}是關(guān)系r的相關(guān)系數(shù)懦趋。

在block-diagonal decomposition,每個W_r^{(l)}通過低維度矩陣相加

W_r^{(l)} = \oplus_{b=1}^B Q_{br}^{(l)} \quad (4)
W_r^{(l)}是block-diagonal矩陣diag(Q_{1r}^{(l)},...,Q_{Br}^{(l)}) \quad with \quad Q_{br}^{(l)} \in R^{d^{(l+1)/B}*(d^{l}/B)}

等式(3)可以被看作不同關(guān)系參數(shù)共享疹味,等式(4)每個關(guān)系在權(quán)重上sparsity constraint
仅叫。block decomposition中,隱藏的特征可以分組成變量集合糙捺,組內(nèi)關(guān)系比組外關(guān)系更緊密诫咱。這兩種方式,都可以減少參數(shù)數(shù)量洪灯,basis decomposition可以解決關(guān)系少見過擬合問題坎缭,因為所有關(guān)系都共享參數(shù)。

R-GCNs遵循以下原則签钩,等式(2)前一層是下一層的輸入掏呼,第一層的輸入如果節(jié)點其他特征,可以使用one-hot铅檩。

三憎夷、應(yīng)用

1.實體識別

半監(jiān)督實體分類,我們通過等式(2)stack R-GCNs layer昧旨,在輸出層采用softmax(.)激活節(jié)點拾给。每個帶標(biāo)簽節(jié)點采用cross-entropy,忽略沒有帶標(biāo)簽的節(jié)點

\zeta = -\sum_{i\in \gamma}\sum_{k=1}^K t_{ik}\,ln\, h_{ik}^{(L)},\quad(5)

\gamma有標(biāo)簽節(jié)點的索引兔沃,h_{ik}^{(L)}是第k層網(wǎng)絡(luò)的輸出蒋得,t_{ik}表示真實的標(biāo)簽。在實踐中粘拾,我們通過隨機梯度法訓(xùn)練模型窄锅。

2.鏈路預(yù)測

鏈路預(yù)測預(yù)測新的三元組创千,知識圖譜生成有向帶標(biāo)簽的圖{G=(V,\varepsilon,R}缰雇,任務(wù)是評估f(s,r,o)到可能的邊{(s,r,o)}入偷,未來決定多大可能性這些邊屬于\varepsilon

為了解決這些問題械哟,我們介紹自編碼模型疏之,有encoder和得分函數(shù)decoder。encoder生成節(jié)點向量暇咆,decoder根據(jù)向量表示重建邊锋爪。通過R^d * R * R^d -> R評估(subject,relation,objection)。我們使用DistMult作為得分函數(shù)爸业,f(s,r,o) = e_s^TR_re_o其骄,R_r\in R^{d*d}是對角矩陣。在訓(xùn)練模型中扯旷,我們還使用了負采樣拯爽,每一個觀測的樣例,我們采樣w個負樣例钧忽,通過cross-entropy優(yōu)化模型毯炮,使用觀察到的三元組數(shù)據(jù)高于負樣例

\zeta=-\frac{1}{(1+w)|\hat{\varepsilon|}}\sum_{(s,r,o,y)\in \tau}y log\quad l(f(s,r,o))+(1-y)log(1-l(f(s,r,o)))
\tau是所有真實的三元組,l是logistic sigmoid函數(shù)耸黑,y=0是負采樣

四桃煎、實驗評估

1. 實體識別

數(shù)據(jù)集:AIFB,MUTAG,BGS,AM


實體識別數(shù)據(jù)集.jpg

Baseline模型:
RDF2vec嵌入向量結(jié)果:在帶標(biāo)簽的節(jié)點中隨機游走,通過skipgram計算實體向量大刊,最后用實體向量來分類为迈。

結(jié)果
RGCNS用的是2層網(wǎng)絡(luò)16個隱藏層單元,訓(xùn)練使用基礎(chǔ)規(guī)則缺菌,優(yōu)化使用Adam曲尸,訓(xùn)練50輪次,學(xué)習(xí)率0.01男翰,正則化參數(shù)c_{i,r}=|N_i^r|

實體識別結(jié)果.jpg

實體識別的結(jié)構(gòu)是10輪次的平均精度另患,我們的模型在AIFB,AM是表現(xiàn)突出。MUTAG是分子圖蛾绎,之后轉(zhuǎn)換成RDF格式昆箕,數(shù)據(jù)集中關(guān)系很少有特征。BGS中巖石類型租冠,有多層特征鹏倘,類似于RDG格式,關(guān)系表示某個特征或特征層級顽爹。MUTAG和BGS的帶標(biāo)簽的實體僅僅與高度中樞節(jié)點有聯(lián)系纤泵,編碼確定的特征。

當(dāng)然镜粤,當(dāng)節(jié)點有很高的度捏题,收集鄰居信息有限制玻褪,我們可以通過引進attention機制,用a_{i,jr}代替正則1/c_{i,r}

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末公荧,一起剝皮案震驚了整個濱河市带射,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌循狰,老刑警劉巖窟社,帶你破解...
    沈念sama閱讀 216,591評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異绪钥,居然都是意外死亡灿里,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評論 3 392
  • 文/潘曉璐 我一進店門程腹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來钠四,“玉大人,你說我怎么就攤上這事跪楞∽喝ィ” “怎么了?”我有些...
    開封第一講書人閱讀 162,823評論 0 353
  • 文/不壞的土叔 我叫張陵甸祭,是天一觀的道長缕碎。 經(jīng)常有香客問我,道長池户,這世上最難降的妖魔是什么咏雌? 我笑而不...
    開封第一講書人閱讀 58,204評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮校焦,結(jié)果婚禮上赊抖,老公的妹妹穿的比我還像新娘。我一直安慰自己寨典,他們只是感情好氛雪,可當(dāng)我...
    茶點故事閱讀 67,228評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著耸成,像睡著了一般报亩。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上井氢,一...
    開封第一講書人閱讀 51,190評論 1 299
  • 那天弦追,我揣著相機與錄音,去河邊找鬼花竞。 笑死劲件,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播零远,決...
    沈念sama閱讀 40,078評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼苗分,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了遍烦?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,923評論 0 274
  • 序言:老撾萬榮一對情侶失蹤躺枕,失蹤者是張志新(化名)和其女友劉穎服猪,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拐云,經(jīng)...
    沈念sama閱讀 45,334評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡罢猪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,550評論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了叉瘩。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片膳帕。...
    茶點故事閱讀 39,727評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖薇缅,靈堂內(nèi)的尸體忽然破棺而出危彩,到底是詐尸還是另有隱情,我是刑警寧澤泳桦,帶...
    沈念sama閱讀 35,428評論 5 343
  • 正文 年R本政府宣布汤徽,位于F島的核電站,受9級特大地震影響灸撰,放射性物質(zhì)發(fā)生泄漏谒府。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,022評論 3 326
  • 文/蒙蒙 一浮毯、第九天 我趴在偏房一處隱蔽的房頂上張望完疫。 院中可真熱鬧,春花似錦债蓝、人聲如沸壳鹤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽器虾。三九已至,卻和暖如春蹦锋,著一層夾襖步出監(jiān)牢的瞬間兆沙,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評論 1 269
  • 我被黑心中介騙來泰國打工莉掂, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留葛圃,地道東北人。 一個月前我還...
    沈念sama閱讀 47,734評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像库正,于是被迫代替她去往敵國和親曲楚。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,619評論 2 354

推薦閱讀更多精彩內(nèi)容