一纺酸、什么是知識圖譜臊岸?
知識圖譜(Knowledge Graph)以語義網(wǎng)來描述現(xiàn)實世界中不同信息之間的關(guān)系疮茄,主要以【實體-關(guān)系-實體】或【實體-屬性-值】三元組作為表達和儲存的方式,如:【鄧超-夫妻-孫儷】和【鄧超-職業(yè)-演員】等丰介,其中對應(yīng)知識圖譜展示如下舵抹。最主要的目的是讓計算機能夠通過知識圖譜理解我們的現(xiàn)實世界肪虎。
@李文哲:知識圖譜本質(zhì)上是語義網(wǎng)絡(luò),是一種基于圖的數(shù)據(jù)結(jié)構(gòu)惧蛹,由節(jié)點(Point)和邊(Edge)組成扇救。在知識圖譜里,每個節(jié)點表示現(xiàn)實世界中存在的“實體”香嗓,每條邊為實體與實體之間的“關(guān)系”迅腔。知識圖譜是關(guān)系的最有效的表示方式。
通俗地講靠娱,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關(guān)系網(wǎng)絡(luò)沧烈。知識圖譜提供了從“關(guān)系”的角度去分析問題的能力。
二像云、知識圖譜有哪些應(yīng)用場景锌雀?
智能搜索
知識圖譜概念最早由Google提出(2012年5月16日)蚂夕,主要是用來優(yōu)化現(xiàn)有的搜索引擎。除了關(guān)鍵字外腋逆,還能通過知識圖譜的關(guān)系網(wǎng)絡(luò)給出關(guān)聯(lián)信息婿牍。
以Google為例,我們可以搜索關(guān)鍵字(Strings)惩歉,如搜索“馬云”等脂,除了馬云基本信息外,還會給出其他相關(guān)的信息撑蚌。
我們還可以搜索事件(Things)慎菲,如搜索“馬云老婆”,能直接給出事件的結(jié)果锨并。
@我偏笑:當用戶發(fā)起搜索時露该,搜索引擎會借助知識圖譜的幫助對用戶查詢的關(guān)鍵詞進行解析和推理,進而將其映射到知識圖譜中的一個或一組概念之上第煮,然后根據(jù)知識圖譜的概念層次結(jié)構(gòu)解幼,向用戶返回圖形化的知識結(jié)構(gòu),這就是我們在谷歌和百度的搜索結(jié)果中看到的知識卡片包警。
智能問答
隨著人工智能的再次興起撵摆,知識圖譜又被廣泛的應(yīng)用于聊天機器人和問答系統(tǒng)中,用于輔助深度理解人類的語言和支持推理害晦,并提升人機問答的用戶體驗等特铝。典型的如IBM的Watson、蘋果的Siri壹瘟、Google Allo鲫剿、Amazon Echo、微軟小冰稻轨、百度度秘等灵莲。
@我偏笑:系統(tǒng)同樣會首先在知識圖譜的幫助下對用戶使用自然語言提出的問題進行語義分析和語法分析,進而將其轉(zhuǎn)化成結(jié)構(gòu)化形式的查詢語句殴俱,然后在知識圖譜中查詢答案政冻。
可視化決策支持
通過提供統(tǒng)一的圖形接口,結(jié)合可視化线欲、推理明场、檢索等,為用戶提供信息獲取的入口李丰。?
東北大學自然語言處理實驗室知識圖譜組苦锨,最近上線的一個“愛圖譜”的知識圖譜演示網(wǎng)站,可以對人工智能一些學術(shù)人員和學術(shù)屬于進行關(guān)聯(lián)知識展示。地址:http://www.neukg.com
@李文哲:基于知識圖譜逆屡,可以提供智能搜索和數(shù)據(jù)可視化的服務(wù)圾旨。可視化的好處不言而喻魏蔗,通過可視化把復雜的信息以非常直觀的方式呈現(xiàn)出來砍的, 使得我們對隱藏信息的來龍去脈一目了然。
三莺治、知識圖譜行業(yè)應(yīng)用有哪些廓鞠?
知識圖譜屬于人工智能的一個分支,同樣需要大量數(shù)據(jù)的支撐谣旁。部分行業(yè)應(yīng)用整理如下(部分資料引用自@PlantData):
企業(yè)通用
·?基于企業(yè)的基礎(chǔ)信息床佳、投資關(guān)系、訴訟榄审、失信等多維度關(guān)聯(lián)數(shù)據(jù)砌们,利用圖計算等方法構(gòu)建科學、嚴謹?shù)钠髽I(yè)風險評估體系搁进,有效規(guī)避潛在的經(jīng)營風險與資金風險浪感。
· 基于投資、任職饼问、專利影兽、招投標、涉訴關(guān)系以目標企業(yè)為核心向外層層擴散莱革,形成一個網(wǎng)絡(luò)關(guān)系圖峻堰,直觀立體展現(xiàn)企業(yè)關(guān)聯(lián)。
·?基于股權(quán)投資關(guān)系尋找持股比例最大的股東盅视,最終追溯至自然人或國有資產(chǎn)管理部門捐名。
·?在基于股權(quán)、任職左冬、專利桐筏、招投標纸型、涉訴等關(guān)系形成的網(wǎng)絡(luò)關(guān)系拇砰,查詢企業(yè)之間的最短關(guān)系路徑,衡量企業(yè)之間的聯(lián)系密切度狰腌〕疲基于企業(yè)知識圖譜中的投融資事件發(fā)生的時間順序,記錄企業(yè)的融資發(fā)展歷
金融證券
·?基于知識圖譜數(shù)據(jù)的統(tǒng)一查詢琼腔,全面掌握客戶信息瑰枫;避免由于系統(tǒng)、數(shù)據(jù)等孤立造成的信息不一致造成信用重復使用、信息不完整等
·?反詐騙光坝,不一致性驗證可以用來判斷一個借款人的欺詐風險尸诽,類似交叉驗。組團進行欺詐的成員會用虛假的身份去申請貸款盯另,但部分信息是共享的性含。
·?其他場景:異常分析(異常交易、異吃Ч撸客戶)商蕴、 失聯(lián)客戶管理、精準營銷芝发、智能投研绪商、智能公告。
生物醫(yī)療
·?針對中醫(yī)藥知識體系系統(tǒng)梳理辅鲸、建模和展示格郁。
·?以圖形可視化方式展示核心概念之間的關(guān)系。
·?輔助中醫(yī)專家厘清學術(shù)發(fā)展脈絡(luò)独悴,瀏覽中醫(yī)知識理张,發(fā)現(xiàn)知識點之間的聯(lián)系。
·?與閱讀文獻等手段相比绵患,可大幅度節(jié)約知識檢索獲取時間雾叭。
相關(guān)項目
·?Watson輔助診斷與治療——安德森癌癥中心聯(lián)合IBM Watson開展終結(jié)癌癥的任務(wù)。
·?歐盟重大聯(lián)合攻關(guān)項目——面向藥物研發(fā)的開放數(shù)據(jù)訪問平臺開發(fā)落蝙,其核心技術(shù)就是采用語義術(shù)為有關(guān)研究人員提供高效的數(shù)據(jù)訪問技術(shù)環(huán)境的支织狐。
圖示情報
·?使用知識圖譜中的知識體系進行知識導航,引導用戶學習知識體系筏勒,以及通過實體鏈接所關(guān)聯(lián)的資源移迫。
電子商務(wù)
·?實現(xiàn)商品數(shù)據(jù)的標準化(商品規(guī)范的統(tǒng)一和商品信息的確定性)。
·?廣泛地應(yīng)用于搜索管行、前端導購厨埋、平臺治理、智能問答捐顷、品牌商運營等核心荡陷、創(chuàng)新業(yè)務(wù)。
農(nóng)業(yè)
·?識別農(nóng)作物危害迅涮。
政府
·?人事關(guān)系管理废赞。
·?政府大數(shù)據(jù)管理。
壹吐
現(xiàn)在連計算機都知道你是單身狗了:)