?在智能對話領域,現(xiàn)在工業(yè)界應用最多的還是用相似度算法來匹配知識庫的做法墩邀。以這種思想構建的聊天機器人一般都不具備真正的智能,聊天的效果在很大程度上依賴于人工編輯的知識庫的質量和數(shù)量翅娶。多輪對話更是沒有效果量承。今天介紹的知識圖譜將能夠進一步挖掘出用戶的聊天意圖,具備一定聯(lián)想和推理能力鞋诗。將改善人機的對話效果膀捷。
一?知識圖譜是什么
? ? ?知識圖譜用一句話說就是用圖的形式去存儲和表示知識。它的組成元素是節(jié)點(Node)和邊(Edge)削彬,節(jié)點代表現(xiàn)實中的萬物担孔,而邊則代表萬物之間的關系。它用圖的形式描繪了我們的現(xiàn)實世界吃警。下面我用知識圖譜表示了日本著名動畫導演宮崎駿和他的作品以及他的作品和演員之間的關系。從圖中可以看出啄育,宮崎駿導演了包括《龍貓》在內的多部電影酌心,而電影《龍貓》的演員有高木均等。這樣千千萬萬個導演挑豌,演員和電影聯(lián)系在一起安券,就形成了一個電影的知識圖譜。
*該圖是用Neo4j展示的氓英,關于Neo4j的詳情將在知識的表示一節(jié)中介紹
二知識圖譜的優(yōu)勢
1.知識表示:知識圖譜形象的表示出了萬事萬物的聯(lián)系侯勉,在表示上很自然,符合人的理解邏輯铝阐。而且可以表現(xiàn)概念和實例的關系址貌,父子的關系等等。
2.知識搜索:知識圖譜用圖的形式去除徘键,在很多場景下將加快知識搜索的效率练对,試想一下,如果讓我們用mysql這樣的數(shù)據庫去存導演吹害,演員和電影的數(shù)據螟凭。要搜索“宮崎駿導演的電影的參演演員有哪些“。這將會是幾張表來回的join它呀。效率極低螺男。而如果我們在圖上搜索棒厘,以宮崎駿這個節(jié)點為起點,進行深度為2的搜索就會搜索到所有的演員下隧。效率將會非常高奢人。
3.推理和擴展:知識圖譜是一個聯(lián)系的世界,我們通過A可以找到B汪拥,通過B又可以找到C达传,而通過C又可以找到其他的東西,這對于知識的推理和擴展具有非常大的左右迫筑。比如宪赶,在上圖中,宮崎駿是龍貓的導演脯燃,高木均是龍貓的演員搂妻。我們能不能推導出宮崎駿和高木均是好朋友呢辕棚?
三知識圖譜的應用
一?智能對話
? ? ? 基于知識圖譜的智能對話系統(tǒng)將比傳統(tǒng)的基于相似度匹配的算法具有較高的準確率欲主。更能理解用戶的意圖
二?推薦系統(tǒng)
? ? ? 如果圖中的節(jié)點時商品或者是人,那根據節(jié)點間的聯(lián)系可以為用戶推薦相關聯(lián)的用戶或商品