作者以及單位
Yixin Cao (National University of Singapore)
通訊作者 何向南
故事核心:挖掘用戶和項(xiàng)目之間進(jìn)一步的關(guān)系延塑,從而提高性能。
解決問題
問題:設(shè)計(jì)了一種新的基于翻譯的推薦模型答渔,解決了KG(知識(shí)圖譜)的不完整性(現(xiàn)有方法主要假設(shè)KG是完整的并且簡(jiǎn)單地在實(shí)體原始數(shù)據(jù)或嵌入的淺層中轉(zhuǎn)移KG中的“知識(shí)”)关带。
具體來說:與之前基于KG的推薦方法不同,我們在KG中傳輸關(guān)系信息沼撕,以便了解用戶喜歡某個(gè)項(xiàng)目的原因宋雏。例如,如果用戶觀看了由(關(guān)系)同一個(gè)人(實(shí)體)指導(dǎo)的幾部電影务豺,我們可以推斷出導(dǎo)演關(guān)系在用戶做出決定時(shí)起著關(guān)鍵作用磨总,從而有助于理解用戶的偏好。更細(xì)的粒度笼沥。
結(jié)果:提高了理解用戶偏好方面的優(yōu)勢(shì)舍败。
研究動(dòng)機(jī)
提出了一個(gè)基于翻譯的用戶偏好模型(TUP),以便與KG無縫集成敬拓。動(dòng)機(jī)是理解在用戶和項(xiàng)目之間存在多個(gè)(隱含的)關(guān)系,這進(jìn)一步揭示了用戶對(duì)消費(fèi)項(xiàng)目的偏好(即原因)裙戏。
創(chuàng)新點(diǎn)
我覺得這個(gè)圖畫的很好乘凸,頂會(huì)果然講究看圖說明問題。
圖表達(dá)的意思在論文的2.3介紹了:
KG完成的目的是為Robert Zemeckis給出明確關(guān)系累榜,如isDirectorOf提供正確的電影(例如营勤,飛越長(zhǎng)生Death Becomes Her灵嫌,不錯(cuò)的電影),而項(xiàng)目推薦旨在為滿足某些隱含偏好的目標(biāo)用戶推薦電影(例如葛作,以前只喜歡回來未來12和阿甘寿羞,不知道飛越長(zhǎng)生),但是知識(shí)圖譜指明這個(gè)飛越長(zhǎng)生也是Robert Zemeckis導(dǎo)演的赂蠢,雖然飛越長(zhǎng)生和回來未來12和阿甘不同風(fēng)格绪穆,也會(huì)推薦給用戶。
因此虱岂,論文通過聯(lián)合模型填補(bǔ)項(xiàng)目推薦和KG完成之間的差距玖院,系統(tǒng)地研究這兩個(gè)任務(wù)如何相互影響。
研究方法
1.提出的方法包括兩個(gè)任務(wù):項(xiàng)目推薦和知識(shí)圖譜補(bǔ)全第岖。
通過聯(lián)合模型TUP填補(bǔ)項(xiàng)目推薦和KG完整之間的差距难菌,系統(tǒng)地研究這兩個(gè)任務(wù)如何相互影響。
本文采用的是聯(lián)合訓(xùn)練蔑滓。是利用聯(lián)合嵌入的方法郊酒,利用kg中的facts作為輔助信息;基于user-item的模擬键袱,填補(bǔ)kg中facts的缺失燎窘。
項(xiàng)目推薦存在的問題:許多方法將基于相似性的方法擴(kuò)展到NN,但是杠纵,它們仍然存在數(shù)據(jù)稀疏性問題和冷啟動(dòng)問題荠耽。基于內(nèi)容的方法通過引入各種輔助信息來處理問題比藻,但是铝量,相關(guān)方法嚴(yán)重依賴于項(xiàng)目和實(shí)體之間的對(duì)齊,但仍未考慮實(shí)體關(guān)系在從KG轉(zhuǎn)移知識(shí)方面的重要性银亲。
知識(shí)圖譜補(bǔ)全存在的問題:最近對(duì)KG補(bǔ)全慢叨,熱衷于研究顯示出對(duì)學(xué)習(xí)實(shí)體和關(guān)系的低維表征,同時(shí)堅(jiān)持圖的結(jié)構(gòu)知識(shí)务蝠。粗略地將學(xué)習(xí)方法分為兩組:平移距離模型和語(yǔ)義匹配模型拍谐。平移距離模型的核心思想,即兩個(gè)實(shí)體之間的關(guān)系對(duì)應(yīng)于它們的向量空間中的平移馏段。雖然它簡(jiǎn)單而有效轩拨,但它有時(shí)會(huì)令人困惑,因?yàn)?strong>某些關(guān)系可以將一個(gè)實(shí)體轉(zhuǎn)換為各種實(shí)體院喜,即1對(duì)N問題亡蓉。第二組通過基于相似性的評(píng)分函數(shù)匹配實(shí)體和關(guān)系的語(yǔ)義表示來測(cè)量事實(shí)的合理性(我看原文好像沒有說這里存在的問題)。
2.提出的模型TUP和KTUP是什么
TUP(Translation-based User Preference):聯(lián)合KG學(xué)習(xí)喷舀,并利用user-item之間的多重隱性關(guān)系砍濒,揭示用戶的偏好淋肾。為了使偏好具有明確的語(yǔ)義,將它們與KG中的關(guān)系對(duì)齊爸邢,項(xiàng)目屬性的類型在用戶決策過程中扮演著至關(guān)重要的角色樊卓。
KTUP(Knowledge-enhanced TUP):將學(xué)習(xí)到的關(guān)系嵌入和實(shí)體嵌入進(jìn)行了從KG遷移到TUP,同時(shí)訓(xùn)練KG的完整性和推薦任務(wù)杠河。聯(lián)合學(xué)習(xí)user碌尔、items、實(shí)體和關(guān)系的表示感猛。將TUP和TransH進(jìn)行聯(lián)合學(xué)習(xí)七扰。
3.這兩個(gè)模型具體是干嘛
3.1TUP: 主要考慮偏好誘導(dǎo)和基于超平面的轉(zhuǎn)化
偏好歸納Preference Induction(我覺得這里的introduction翻譯歸納比較好):設(shè)計(jì)了兩種偏好誘導(dǎo)策略:一種是從潛在因子P個(gè)偏好中選擇一個(gè)的Hard Strategy和一種將所有偏好與注意力結(jié)合起來的soft Strategy。
Hard Strategy:推薦有效的單一偏好陪白,利用得分函數(shù)(點(diǎn)積)
soft Strategy:通過注意力機(jī)制(attention mechanism)來聯(lián)合多重偏好颈走。
基于超平面的轉(zhuǎn)化:解決不同的用戶可以對(duì)不同的項(xiàng)目共享相同的偏好(即,N對(duì)N問題)咱士。以前的方法a為了解決一個(gè)用戶同時(shí)喜歡2個(gè)items立由,那么這兩個(gè)Items的用戶嵌入就很接近。我理解的意思是序厉,無論用戶的偏好是什么锐膜,兩個(gè)item近不近沒有關(guān)系,消費(fèi)者都應(yīng)該消費(fèi)另一方弛房,怕理解錯(cuò)(原文是leading to an incorrect conclusion that a user consuming one shall consume the other, no matter what the user’s preference is.)而b所示的偏差超平面來減輕這種限制道盏,并且僅當(dāng)它們被投影到特定超平面時(shí)才是相似的(在不同平面item沒有關(guān)系)。
3.2 KTUP通過結(jié)合實(shí)體的KG知識(shí)以及關(guān)系來擴(kuò)展基于翻譯的推薦模型TUP
首先文捶,有兩個(gè)輸入荷逞,一個(gè)輸入是item,一個(gè)輸入是kg粹排。
其次种远,有三個(gè)層次,最上層次是項(xiàng)目推薦的TUP顽耳,包括兩個(gè)組件:偏好感應(yīng)和基于超平面的翻譯坠敷。最下層是知識(shí)圖譜補(bǔ)全的TransH。中間層 KTUP聯(lián)合學(xué)習(xí)TUP和TransH射富,通過轉(zhuǎn)移實(shí)體知識(shí)和關(guān)系來增強(qiáng)項(xiàng)目和偏好建模膝迎。
總體目標(biāo)函數(shù)訓(xùn)練KTUP,如下所示(Lp是TUP胰耗, Lk是KG弄抬,總函數(shù)比較好理解):
結(jié)論
TUP能夠?qū)τ脩艉晚?xiàng)目之間的各種隱式關(guān)系建模,這揭示了用戶對(duì)消費(fèi)項(xiàng)目的偏好宪郊。
KTUP通過對(duì)齊的關(guān)系和權(quán)限進(jìn)一步增強(qiáng)了模型的可解釋性掂恕,并通過聯(lián)合學(xué)習(xí)提高了兩個(gè)任務(wù)的性能。
總的來說弛槐,我抓大放小突出了這篇文章的工作懊亡。如果看懂了,會(huì)覺得“可能很簡(jiǎn)單”乎串,因?yàn)橹饕枷刖褪茿B兩個(gè)模型共同融合做出推薦結(jié)果店枣,A負(fù)責(zé)把item推薦優(yōu)化的更好,B負(fù)責(zé)把知識(shí)圖譜推薦優(yōu)化好叹誉,然后弄個(gè)超參學(xué)習(xí)一下鸯两,共同決策結(jié)果,符合一般的組合模型設(shè)計(jì)思路长豁。
但其實(shí)無論是在TUP和KTUP的設(shè)計(jì)過程中钧唐,細(xì)節(jié)考慮的工作特別多,建構(gòu)的設(shè)想也很多匠襟,應(yīng)該是看了不少文獻(xiàn)钝侠,把這些文獻(xiàn)的問題拿捏的很準(zhǔn),動(dòng)機(jī)合理酸舍,故事說的很好帅韧。最后的實(shí)驗(yàn)工作量很大,方方面面都測(cè)試到了啃勉。投頂會(huì)果然是每個(gè)細(xì)節(jié)都做到完美了忽舟。
參考
統(tǒng)一知識(shí)圖譜學(xué)習(xí)和建議:更好地理解用戶偏好_XD的學(xué)習(xí)筆記-CSDN博客