知識圖譜(Knowledge Graph)以結(jié)構(gòu)化的形式描述客觀世界中概念、實體及其關(guān)系砾省,將互聯(lián)網(wǎng)信息表達(dá)成更接近人類認(rèn)知世界的形式鸡岗,目前主要應(yīng)用于搜索、推薦编兄、智能問答等領(lǐng)域轩性,接下來會簡要整理目前主要的KG落地應(yīng)用。
[ 相關(guān)筆記 ]
產(chǎn)品 | 知識圖譜落地應(yīng)用:智能問答
產(chǎn)品 | 知識圖譜落地應(yīng)用:金融投資領(lǐng)域
1. 搜索
知識圖譜技術(shù)最先應(yīng)用于搜索狠鸳,最初由谷歌公司在2012年5月提出(2012年5月17日揣苏,谷歌發(fā)布知識圖譜項目,并宣布以此為基礎(chǔ)構(gòu)建下一代智能化搜索引擎)件舵。知識圖譜技術(shù)在搜索的落地包括:
a. 語義搜索:實現(xiàn)Web從網(wǎng)頁鏈接向概念鏈接轉(zhuǎn)變卸察,支持用戶按主題而不是字符串檢索
b. 關(guān)系搜索:獲取兩個實體之間的關(guān)系,例如公司之間的關(guān)系铅祸、人物之間的關(guān)系等
c. 結(jié)構(gòu)化展現(xiàn):以圖形化方式向用戶展示經(jīng)過分類整理的結(jié)構(gòu)化知識坑质,從而使人們從人工過濾網(wǎng)頁尋找答案的模式中解脫出來
1.1 語義搜索
a. 關(guān)鍵詞增強型
[ 原理 ] 核心仍然是傳統(tǒng)的搜索引擎,知識圖譜技術(shù)以多種途徑被用來增強關(guān)鍵詞搜索临梗,以此來改善搜索的查全率和查準(zhǔn)率涡扼。基本原理是事先定義詞的同義詞盟庞、上下位詞等詞集合吃沪,當(dāng)關(guān)鍵詞被檢索時,其他與該關(guān)鍵詞相關(guān)的詞也通過圖搜索的方式也被檢索出來什猖,用來擴展或約束搜索
[ 場景 ] 更加全面票彪、準(zhǔn)確的查找自己需要的信息
[ 落地 ] 谷歌红淡、百度等
e.g 在谷歌中搜“西紅柿”,可以檢索到“番茄”的相關(guān)結(jié)果(不一定是用KG技術(shù)實現(xiàn)的降铸,但基本意思是這樣)
b. 答案檢索型
[ 原理 ] 對用戶使用自然語言提出的問題進(jìn)行語義分析和語法分析在旱,進(jìn)而將其轉(zhuǎn)化成結(jié)構(gòu)化形式的查詢語句,然后在知識圖譜中查詢答案
[ 場景 ] 直接找到問題的答案垮耳,而非大量的網(wǎng)頁鏈接
[ 落地 ] 谷歌颈渊、百度等(部分查詢)
e.g.1 在百度搜索“阿里巴巴市值”遂黍,結(jié)果list中的第一條直接返回答案
e.g.2 在百度中搜索“馬云的妻子的兒子”(不一定是用KG技術(shù)實現(xiàn)的终佛,但基本意思是這樣),結(jié)果list中的第一條直接返回答案
1.2 關(guān)系搜索
[ 場景 ] 快速準(zhǔn)確地查詢兩個實體之間的關(guān)系
[ 落地 ] 天眼查雾家、全歷史
1.3 結(jié)構(gòu)化展現(xiàn)
系統(tǒng)收集信息铃彰,建立知識庫,用戶通過圖形用戶接口(可視化的本體概念樹)或關(guān)鍵詞提交查詢芯咧,系統(tǒng)返回用戶所查找概念的所有實例
[ 場景1 ] 快速有效地檢索出某個概念的所有實例
例如:天眼查牙捉、全歷史、Magi
e.g.1 在天眼查(網(wǎng)頁)中搜索“騰訊公司”敬飒,可查看與該公司有關(guān)系的實例(法人邪铲、分支機構(gòu)等)
e.g.2 在全歷史(app)關(guān)系圖譜模塊點擊“秦始皇”,系統(tǒng)返回秦始皇相關(guān)的實例(親情无拗、敵對带到、成就等),再依次點擊“成就--韓國”英染,可查看秦始皇滅掉韓國的成就
e.g.3 在Magi中搜索“智能問答”揽惹,返回對應(yīng)的實體、關(guān)系及屬性等信息
[ 場景2 ] 解決一詞多義的情況
通常情況下四康,詞語只有在特定的語境之下才能表達(dá)出精確的意思搪搏,單獨搜索某個詞語經(jīng)常會面臨一詞多義的情況。 例如“蘋果”可以是一種水果闪金,也可以是科技公司疯溺、手機、電腦哎垦;泰姬陵( Taj Mahal) 既可以指一個遺跡喝检,也可以指一個音樂家钧舌。如果我們在谷歌中搜索“泰姬陵 ”务傲,在右側(cè)泌枪,谷歌會給出泰姬陵的地圖及相關(guān)介紹庆揪,也會在下方將同名的條目列出來定鸟。借助知識圖譜堪旧, 谷歌可以理解實體和實體含義間的細(xì)微差別音五,并且將所有可能的結(jié)果歸納分組亿汞,讓檢索更加智能。