Ma T, Xiao C, Zhou J, et al. Drug similarity integration through attentive multi-view graph auto-encoders[J]. arXiv preprint arXiv:1804.10850, 2018.
摘要相關(guān)
藥物相似相的研究對于支持下游的臨床任務(wù)抖剿,如從已知的特性推斷新藥物的副作用缚柳、適應(yīng)癥和相互作用有著很大的推進(jìn)。隨著新型藥物特征的日益普及雁乡,為學(xué)習(xí)更全面和準(zhǔn)確的相似性帶來了新的機(jī)會婚度。本文提出從多種類型的藥物特征中學(xué)習(xí)較為準(zhǔn)確和可解釋的相似性度量方法。具體來說,本文使用多視圖圖自動編碼器對集成進(jìn)行建模鼓蜒,并添加了注意機(jī)制來確定每個視圖對應(yīng)于相應(yīng)任務(wù)和特征的權(quán)重,以獲得更好的可解釋性。
- 將藥物的每個特征看做一個視圖
- 使用多視圖GAE來整合學(xué)習(xí)藥物的相似性
- 對于單個視圖使用GCN編碼節(jié)點特征和邊
- 視圖之間則使用基于注意力的選擇方案進(jìn)行非線性融合
模型淺析
本文以藥物的每個特征表示作為一個視圖都弹。給定視圖娇豫,以每個藥物為節(jié)點,以兩節(jié)點之間的相似性作為邊畅厢》肓。可以得到每個視圖的節(jié)點特征嵌入表示
,以及樣本對之間的相似性
或详。給定
個不同的視圖系羞,多視圖相似性整合任務(wù)是在全視圖中得到統(tǒng)一的節(jié)點嵌入
和相似性矩陣
。
-
Similarity Integration with Attentive Multi-view Graph Autoencoders
基礎(chǔ)的多視圖GraphCNN結(jié)構(gòu)
給定視圖霸琴,視圖的鄰接矩陣和對角陣定義如下:
,以拼接的方式得到新的節(jié)點表示
梧乘。兩個節(jié)點之間的連接預(yù)測由sigmoid函數(shù)得到澎迎。
相似矩陣的融合
該融合的目的是得到一個多視圖統(tǒng)一的圖矩陣。
(1)對每個相似性矩陣進(jìn)行標(biāo)準(zhǔn)化
(2)鄰接矩陣整合,
是融合的權(quán)重选调。
(3)使用一層GraphCNN去編碼圖中的節(jié)點
在沒有數(shù)據(jù)標(biāo)簽的情況下夹供,可以使用auto-encoder的重構(gòu)損失進(jìn)行約束也可以用于其他任務(wù)哮洽,如節(jié)點聚類。
基于注意力的視圖選擇
假設(shè)當(dāng)前視圖的鄰接矩陣為弦聂,本文給每個視圖都分配一個注意力權(quán)重
鸟辅。整合后的鄰接矩陣表示為
,
是元素的對應(yīng)相乘莺葫。對于每個視圖匪凉,首先每個原始的鄰接矩陣被映射為一個非正則的矩陣
,然后對其進(jìn)行正則化得到
捺檬。為了降低計算的復(fù)雜度再层,本文將
的鄰接矩陣替換為一個對角的注意力矩陣。具體來說堡纬,將
限制為一個向量聂受,并通過diag
形成加權(quán)相似度矩陣。
進(jìn)一步的隐轩,將注意力權(quán)重進(jìn)行歸一化
被用于得到最后的相似性矩陣
)是由其生成的對角矩陣饺饭。
-
A Semi-supervised Extension Given Partial Labeled Data
由得到的進(jìn)行節(jié)點連接關(guān)系的預(yù)測,將標(biāo)簽數(shù)據(jù)應(yīng)用到模型的訓(xùn)練中:
為了進(jìn)一步在重構(gòu)的過程中也考慮圖的拉普拉斯正則职车,將前面替換為帶有權(quán)重的圖結(jié)構(gòu)正則瘫俊。表示為
鹊杖,該目標(biāo)函數(shù)用GAE的重建損失取代了第二項,也顯式地建模了圖的結(jié)構(gòu)信息扛芽。
總的來說沒有新的操作骂蓖,可能也是因為這是18年的論文。但是想法很巧妙川尖,對A矩陣的操作可以更好的挖掘節(jié)點之間的連接關(guān)系登下。