行業(yè)知識圖譜應用

目錄

行業(yè)知識圖譜簡介
行業(yè)知識圖譜應用
行業(yè)KG應用挑戰(zhàn)
行業(yè)知識圖譜生命周期

行業(yè)知識圖譜簡介

行業(yè)知識圖譜工具:Palantir


行業(yè)知識圖譜的特點

行業(yè)KG應用

金融證券——企業(yè)知識圖譜
應用——企業(yè)風險評估
應用——企業(yè)社交圖譜查詢
應用——企業(yè)最終控制人查詢
應用——企業(yè)之間路徑發(fā)現(xiàn)
應用——初創(chuàng)企業(yè)融資發(fā)展歷程
應用——上市企業(yè)智能問答
金融證券——金融交易知識圖譜
應用——輔助信貸審核
應用——反欺詐淡诗、組團欺詐

  • 醫(yī)療知識圖譜
  • 圖書情報

行業(yè)知識圖譜應用挑戰(zhàn)

知識圖譜助力企業(yè)商業(yè)智能

行業(yè)知識圖譜生命周期

知識圖譜生命周期
  • RDF:三元組(triple)模型畏纲,SPO(主謂賓)
  • OWL:RDF Schema的擴展
    包括:復雜類漾唉;屬性約束送膳;屬性特征;屬性鏈
  • SPARQL
    RDF查詢語言:基于RDF數(shù)據(jù)類型
    SPARQL查詢圖可視化
    本體(ontology)可以填充知識與查詢之間的間隙碍现,具有推理的能力
  1. 知識建模
    建立知識圖譜的數(shù)據(jù)模式蚂维。行業(yè)知識圖譜的數(shù)據(jù)模式對整個知識圖譜的結(jié)構(gòu)進行定義篱竭,因此需要保證可靠性。
    常用方法:
  • 自頂向下的方法:專家手工編輯形成數(shù)據(jù)模式
  • 自底向上的方法:基于現(xiàn)有的標準進行轉(zhuǎn)換役首;
    從現(xiàn)有的高質(zhì)量行業(yè)數(shù)據(jù)源中進行映射尝丐。
  1. 知識獲取


    知識獲取方式
  2. 知識融合
  • 數(shù)據(jù)模式層融合
    概念合并
    概念上下位關(guān)系合并
    概念的屬性定義合并
  • 數(shù)據(jù)層融合
    實體合并
    實體屬性融合
    沖突檢測與解決
  1. 知識存儲
    三元組知識的存儲;
    事件信息的存儲
    時態(tài)信息的存儲宋税;
    使用知識圖譜組織的數(shù)據(jù)的存儲
  • 知識圖譜上層應用需要支持:
    知識推理摊崭;
    知識快速查詢;
    圖實時計算
  1. 知識計算
    圖挖掘計算:基于圖論的相關(guān)算法杰赛,實現(xiàn)對圖譜的探索和挖掘呢簸;
    本體推理:使用本體推理進行新知識發(fā)現(xiàn)或沖突檢測;
    基于規(guī)則的推理:使用規(guī)則引擎,編寫相應的業(yè)務規(guī)則根时,通過推理輔助業(yè)務決策瘦赫。
  2. 知識應用

一站式工具

  • LOD2
  • Stardog
    把關(guān)系數(shù)據(jù)庫映射成虛擬圖;
    支持OWL2的推理蛤迎;
    支持Gremlim;
    但Stardog僅包含對結(jié)構(gòu)化數(shù)據(jù)(RDBMS确虱,Excel等)的處理,沒有針對非結(jié)構(gòu)化數(shù)據(jù)的知識抽取替裆,沒有知識融合的功能校辩。

1 知識建模

  • 實體為主要目標,實現(xiàn)對不同來源的數(shù)據(jù)進行映射與合并辆童。(實體抽取與合并)
  • 利用屬性來表示不同數(shù)據(jù)源中針對實體的描述宜咒,形成對實體的全方位描述。(屬性映射與歸并)
  • 利用關(guān)系來描述各類抽象建模成實體的數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系把鉴,從而支持關(guān)聯(lián)分析故黑。(關(guān)系抽取)
  • 通過實體鏈接技術(shù)庭砍,實現(xiàn)圍繞實體的多種類型數(shù)據(jù)的關(guān)聯(lián)存儲场晶。(實體鏈接)
  • 使用事件機制描述客觀世界中動態(tài)發(fā)展,體現(xiàn)事件與實體間的關(guān)聯(lián)怠缸;并利用時序描述事件的發(fā)展狀況诗轻。(動態(tài)事件描述)

知識建模工具——Protege
本體編輯器;
基于RDF(S)凯旭,OWL等語義網(wǎng)規(guī)范概耻;
圖形化界面;
提供了在線版本——WebProtege
適用于原型構(gòu)建場景

構(gòu)建一個適用的建模工具
  1. 在線并發(fā)編輯支持罐呼;
  2. 多用戶共同編輯;上下位關(guān)系定義侦高,屬性定義編輯
  3. 提供導入嫉柴、集成功能;
  4. 以存儲為橋梁奉呛,可以對自動算法的結(jié)果進行編輯计螺;
  5. 支持對動態(tài)事件數(shù)據(jù)的建模,使用時態(tài)信息存儲實現(xiàn)事件時間描述瞧壮;
  6. 支持大數(shù)據(jù)量的知識圖譜編輯登馒。

2 知識獲取

結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化咆槽,非結(jié)構(gòu)化

  • D2R工具——D2RQ
    將關(guān)系數(shù)據(jù)庫轉(zhuǎn)換為虛擬的RDF數(shù)據(jù)庫的平臺
  • 包裝器
    半結(jié)構(gòu)化行業(yè)數(shù)據(jù)源解析
  • 文本信息抽取
    OpenIE:面向開放領域抽取信息
    工具:ReVerb陈轿、TextRunner
    CloseIE:面向特定領域抽取信息
    工具:DeepDive

3 知識融合

包括數(shù)據(jù)模式層(概念、概念的上下位關(guān)系、概念的屬性)的融合與數(shù)據(jù)層的融合

4 知識存儲

兩種方式:RDF存儲和圖數(shù)據(jù)庫(Graph Database)
常見的圖數(shù)據(jù)存儲——Graph DBMS

  • Neo4j
    原生圖存儲和處理麦射;
    支持ACID事務處理蛾娶;
    不適用Schema

5 知識計算

1 圖挖掘計算

  • 圖遍歷:廣度優(yōu)先遍歷,深度優(yōu)先遍歷
  • 最短路徑查詢:Dijkstra潜秋、Floyd
  • 路徑探尋:給定兩個或多個節(jié)點蛔琅,發(fā)現(xiàn)它們之間的關(guān)聯(lián)關(guān)系
  • 權(quán)威節(jié)點分析:PageRank算法
  • 族群發(fā)現(xiàn):最大流算法
  • 相似節(jié)點發(fā)現(xiàn):基于節(jié)點屬性、關(guān)系的相似度算法

2 基于本體的推理

  • 基于表運算及改進的方法:FaCT++峻呛、Racer罗售、Pellet Hermit等
  • 基于一階查詢重寫的方法(Ontology based data access)
  • 基于產(chǎn)生式規(guī)則的算法(如rete):Jena、Sesame钩述、OWLIM等
  • 基于Datalog轉(zhuǎn)換的方法如KAON寨躁、RDFox等
  • 回答集程序 Answer set programming

3 基于規(guī)則的推理
工具:Drools 規(guī)則定義

6 知識應用

  • 語義搜索
    基于實體鏈接的語義搜索;
    基于知識圖譜的語義搜索
  • 智能問答
    基于信息檢索的方法
    基于語義解析的方法
    基于規(guī)則的專家系統(tǒng)的方法
    基于深度學習的方法
    優(yōu)點:實現(xiàn)“端到端”的問答切距,把問題與答案均使用復雜的特征向量表示朽缎,使用深度學習來計算問題與答案的相似度。
  • 可視化輔助決策
    工具:D3.js谜悟,ECharts


    知識圖譜總覽

知識圖譜相關(guān)書籍:

Exploiting Linked Data and Knowledge Graphs in Large Organisations

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末话肖,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子葡幸,更是在濱河造成了極大的恐慌最筒,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蔚叨,死亡現(xiàn)場離奇詭異床蜘,居然都是意外死亡,警方通過查閱死者的電腦和手機蔑水,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進店門邢锯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人搀别,你說我怎么就攤上這事丹擎。” “怎么了歇父?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵蒂培,是天一觀的道長。 經(jīng)常有香客問我榜苫,道長护戳,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任垂睬,我火速辦了婚禮媳荒,結(jié)果婚禮上抗悍,老公的妹妹穿的比我還像新娘。我一直安慰自己肺樟,他們只是感情好檐春,可當我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著么伯,像睡著了一般疟暖。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上田柔,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天俐巴,我揣著相機與錄音,去河邊找鬼硬爆。 笑死欣舵,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的缀磕。 我是一名探鬼主播缘圈,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼袜蚕!你這毒婦竟也來了糟把?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤牲剃,失蹤者是張志新(化名)和其女友劉穎遣疯,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體凿傅,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡缠犀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了聪舒。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片辨液。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖箱残,靈堂內(nèi)的尸體忽然破棺而出室梅,到底是詐尸還是另有隱情,我是刑警寧澤疚宇,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站赏殃,受9級特大地震影響敷待,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜仁热,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一榜揖、第九天 我趴在偏房一處隱蔽的房頂上張望勾哩。 院中可真熱鬧,春花似錦举哟、人聲如沸思劳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽潜叛。三九已至,卻和暖如春壶硅,著一層夾襖步出監(jiān)牢的瞬間威兜,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工庐椒, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留椒舵,地道東北人。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓约谈,卻偏偏與公主長得像笔宿,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子棱诱,可洞房花燭夜當晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容