剛接觸知識(shí)圖譜烈掠,最近也在學(xué)習(xí)王昊奮老師的視頻,做小小的總結(jié)缸托,不好的地方多多指正左敌!
一、知識(shí)圖譜(Knowledge Graph俐镐,KG)與語義技術(shù)概述
KG矫限,2012谷歌提出,作用是能輔助搜索(從網(wǎng)頁搜索到語義搜索佩抹,從文本鏈接到數(shù)據(jù)鏈接)叼风,輔助問答,輔助決策棍苹,輔助AI(常識(shí)推理)无宿;
人的記憶偏重關(guān)聯(lián);
知識(shí)表示方法:框架系統(tǒng)枢里、產(chǎn)生式規(guī)則孽鸡、描述邏輯;
知識(shí)庫形成:手工眾包坡垫、格式轉(zhuǎn)化梭灿、元組抽取、實(shí)體融合冰悠、鏈接預(yù)測(cè)堡妒、推理預(yù)測(cè)、語義嵌入
二溉卓、典型知識(shí)庫系統(tǒng)簡介
CYC:常識(shí)知識(shí)庫皮迟,由術(shù)語Term和斷言Assertions組成,http://www.cyc.com
Wordnet:英文詞典知識(shí)庫桑寨,主要用于詞義消歧http://wordnet.princeton.com/
ConceptNet:常識(shí)知識(shí)庫伏尼,三元組形式的關(guān)系型知識(shí)構(gòu)成,更加自然語言的描述http://conceptnet.io/
Freebase:開源免費(fèi)允許商業(yè)http://www.freebase.com
Wikidata:http://wikidata.org/
DBPedia:http://dbpedia.org
YAGO:集成Wikidata尉尾、Wordne爆阶、GeoNameshttp://mpii.de/yago
Babelnet:多語言詞典數(shù)據(jù)庫http://babelnet.org/
NELL:三元組知識(shí)庫,采用互聯(lián)網(wǎng)挖掘的方法從Web自動(dòng)抽取http://rtw.ml.cmu.edu/
微軟Concept Graph:用于文本理解和語義消歧http://concept.research.microsoft.com
Open KG:中文KG資源庫
Zhshi.me:http://zhishi.me
cnSchema:基于社區(qū)維護(hù)的開中文KGhttp://caschema.org
三、KG技術(shù)概覽
什么是知識(shí)表示辨图?
利用計(jì)算機(jī)符號(hào)來表示人腦中的知識(shí)班套,以及通過符號(hào)之間的運(yùn)算來模擬人腦的推理過程。
語義網(wǎng)知識(shí)表示框架?
什么是三元組:主(節(jié)點(diǎn))謂(邊)賓(節(jié)點(diǎn))
SPARQL是RDF的查詢語言故河,類似SQL
JSON-LD:數(shù)據(jù)交換格式????
RDFa吱韭,HTML5 MicroData:在網(wǎng)頁中嵌入語義數(shù)據(jù)
知識(shí)抽取:NLP(自然語言)+KR(知識(shí)推理)
知識(shí)存儲(chǔ):基于關(guān)系數(shù)據(jù)庫的存儲(chǔ)和基于原生圖的的存儲(chǔ)
知識(shí)問答(KBQA):有一個(gè)知識(shí)庫回答提問
知識(shí)推理:基于已知事實(shí)推出未知的事實(shí),分類:(解決方法)基于描述邏輯鱼的、規(guī)則挖掘理盆、概率邏輯、學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的推理凑阶,(推理類型)缺省猿规、連續(xù)變化、空間宙橱、因果關(guān)系推理
知識(shí)融合:工具-Dedupe(基于python的工具包)坎拐,工具-LIMES,不要求兩個(gè)數(shù)據(jù)集的實(shí)體具有相似的數(shù)據(jù)結(jié)構(gòu)http://openkg/tool/limes
知識(shí)眾包:Wikibase、Schema.ORG?
四养匈、典型案列簡介
Open PHACTS(歐盟重大聯(lián)合攻關(guān)項(xiàng)目)哼勇,面向藥物研發(fā)
中醫(yī)藥知識(shí)平臺(tái)
電商知識(shí)圖譜(阿里):電商管控,自動(dòng)審核呕乎,不良商品下架
企業(yè)知識(shí)圖譜應(yīng)用(SAP)
金融:鏈接金融數(shù)據(jù)
大英博物館:知識(shí)圖譜與本體設(shè)計(jì)
BBC:打通BBC全領(lǐng)域