知識圖譜筆記 1 知識圖譜概論

知識圖譜與語義技術(shù)概述:

Vannevar Bush

Sir Tim Berners-Lee:以鏈接為中心的系統(tǒng)

語義網(wǎng):從鏈接文本到鏈接數(shù)據(jù)

語義網(wǎng)絡(luò)(Semantic Network)->本體論(Ontology)->Web->The Semantic Web->Link Data->知識圖譜(Knowledge Graph,KG)

KG輔助搜索鹦赎,從文本搜索變?yōu)檎Z義搜索。

手工眾包作儿,格式轉(zhuǎn)化迅箩,元組抽取,實(shí)體融合屋摇,鏈接預(yù)測揩魂,推理補(bǔ)全,語義嵌入炮温。

KG輔助問答火脉,輸入自然語言,返回精確答案。

給萬物都掛接一個(gè)背景知識庫倦挂。

KG輔助決策畸颅。

預(yù)先抽取語義->建立數(shù)據(jù)鏈接,不規(guī)范數(shù)據(jù)表達(dá)->規(guī)范數(shù)據(jù)表達(dá)方援,粗糙數(shù)據(jù)->可計(jì)算數(shù)據(jù)没炒。

Palantir:動態(tài)本體、Kensho:金融知識圖譜犯戏。

KG輔助AI送火,常識推理。

KG的本質(zhì):

Web視角:像建立文本之間的超鏈接一樣先匪,建立數(shù)據(jù)之間的語義鏈接种吸,并支持語義的搜索。

NPL視角:怎樣從文本中抽取語義和結(jié)構(gòu)化數(shù)據(jù)呀非。

深度學(xué)習(xí)->學(xué)習(xí)

知識圖譜->推理

各種知識圖譜項(xiàng)目:

CYC:常識知識庫骨稿。

包括了術(shù)語Terms(詞)、斷言Assertions(句子)

Wordnet:英語詞義消歧姜钳。

ConceptNet:常識知識庫坦冠。

主要依靠互聯(lián)網(wǎng)眾包、專家創(chuàng)建哥桥、游戲三種方法構(gòu)建辙浑。

以三元組(主謂賓)形式的關(guān)系型知識構(gòu)成,更加接近自然語言拟糕。

Freebase:通過開源免費(fèi)吸引用戶判呕。

Wikidata:目標(biāo)是構(gòu)建全世界最大的免費(fèi)知識庫。

DBPedia:數(shù)據(jù)庫版本的Wikipedia送滞。

YAGO:集成了Wikipedia侠草、Wordnet、GeoNames三個(gè)來源的數(shù)據(jù)犁嗅。

考慮了時(shí)間和空間維度的擴(kuò)展边涕。

Babelnet:多語言詞典知識庫。

NELL:互聯(lián)網(wǎng)挖掘方法從Web自動抽取三元組知識褂微。

Concept Graph:以概念層次體系為中心的知識圖譜功蜓。

OpenKG:中文知識圖譜。

Zhishi.me:合成中文數(shù)據(jù)庫宠蚂。

cnSchema:開放的中文知識圖譜Schema式撼。

知識圖譜技術(shù)概覽:

數(shù)據(jù)來源:文本、結(jié)構(gòu)化數(shù)據(jù)庫求厕、多媒體著隆、傳感器扰楼、眾包->KG Data。

基于數(shù)理邏輯的知識表示->基于向量空間學(xué)習(xí)的分布式知識表示美浦。

語義網(wǎng)知識表示框架:

RDF:Triple-based Assertion model

主語弦赖、賓語是節(jié)點(diǎn),謂語是邊抵代。

RDF Graph:Directed Labeled Graph

基本數(shù)據(jù)模型:有向標(biāo)記圖。

RDFS:Simple Vocabulary and Schema(類比數(shù)據(jù)庫表忘嫉、字段的設(shè)計(jì))

OWL:本體(Ontology)是一個(gè)概念和關(guān)系的描述荤牍,是對其形式化的定義。通過規(guī)范描述庆冕。

OWL extends RDF Schema

SPARQL:RDF的查詢語言康吵。類SQL的聲明式的查詢語言。

子圖匹配访递。

JSON-LD:數(shù)據(jù)交換格式晦嵌。適用于作為程序之間做數(shù)據(jù)交換。

RDFa拷姿、HTML5 MicroData:在網(wǎng)頁中嵌入語義數(shù)據(jù)惭载。

KG的分布式表示:

KG Embedding:KG的分布式表示,在保留語義的同時(shí)响巢,將知識圖譜中的實(shí)體和關(guān)系映射到連續(xù)的稠密的低維向量空間描滔。

張量分解、神經(jīng)網(wǎng)絡(luò)踪古、距離模型(翻譯模型)含长。

知識抽取:NLP + KR:

非結(jié)構(gòu)化文本數(shù)據(jù)->文本預(yù)處理->分詞伏穆、詞性標(biāo)注拘泞、語法解析、依存分析->NER命名實(shí)體識別枕扫、Entity Linking實(shí)體鏈接->關(guān)系抽取陪腌、事件抽取->KR:三元組、多元關(guān)系烟瞧、模態(tài)知識

基于知識工程(正則偷厦、模板匹配、規(guī)則約束)

基于本體抽取(知識挖掘燕刻,PRA)

基于模型的抽取(模型只泼、訓(xùn)練)

知識存儲:

基于干系數(shù)據(jù)庫的存儲、基于原生圖的存儲卵洗。

知識問答:

KBQA基于知識庫的問題回答请唱。

語義解析->語義表示->查詢數(shù)據(jù)庫->返回用戶

知識推理:

基于已知事實(shí)推出未知事實(shí)的計(jì)算過程弥咪。

缺省推理、連續(xù)變化推理十绑、空間推理聚至、因果關(guān)系推理。

基于描述邏輯的推理-本體推理:

描述邏輯是一種用于知識表示的邏輯語言和以其為對象的推理方法本橙。

知識融合:

在不同數(shù)據(jù)集中找出同一個(gè)實(shí)體扳躬。

Dedupe基于python的工具包。

LIMES不要求兩個(gè)數(shù)據(jù)集的實(shí)體具有相似的結(jié)構(gòu)甚亭。

知識眾包:

Wikibase贷币、Schema.ORG

典型案例簡介:

Open PHACTS:藥物研發(fā)的開放數(shù)據(jù)訪問平臺。

SAP:企業(yè)知識圖譜應(yīng)用亏狰。

BBC ONTOLOGIES:更好的搜索體驗(yàn)役纹。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市暇唾,隨后出現(xiàn)的幾起案子促脉,更是在濱河造成了極大的恐慌,老刑警劉巖策州,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件瘸味,死亡現(xiàn)場離奇詭異,居然都是意外死亡够挂,警方通過查閱死者的電腦和手機(jī)硫戈,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來下硕,“玉大人丁逝,你說我怎么就攤上這事∷笮眨” “怎么了霜幼?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長誉尖。 經(jīng)常有香客問我罪既,道長,這世上最難降的妖魔是什么铡恕? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任琢感,我火速辦了婚禮,結(jié)果婚禮上探熔,老公的妹妹穿的比我還像新娘驹针。我一直安慰自己,他們只是感情好诀艰,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布柬甥。 她就那樣靜靜地躺著饮六,像睡著了一般。 火紅的嫁衣襯著肌膚如雪苛蒲。 梳的紋絲不亂的頭發(fā)上卤橄,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天,我揣著相機(jī)與錄音臂外,去河邊找鬼窟扑。 笑死,一個(gè)胖子當(dāng)著我的面吹牛漏健,可吹牛的內(nèi)容都是我干的嚎货。 我是一名探鬼主播,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼漾肮,長吁一口氣:“原來是場噩夢啊……” “哼厂抖!你這毒婦竟也來了茎毁?” 一聲冷哼從身側(cè)響起克懊,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎七蜘,沒想到半個(gè)月后谭溉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡橡卤,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年扮念,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片颠区。...
    茶點(diǎn)故事閱讀 39,977評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蝇裤,死狀恐怖愕把,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情弄匕,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布沽瞭,位于F島的核電站迁匠,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏驹溃。R本人自食惡果不足惜城丧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望豌鹤。 院中可真熱鬧亡哄,春花似錦、人聲如沸布疙。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至拣挪,卻和暖如春擦酌,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背菠劝。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工赊舶, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人赶诊。 一個(gè)月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓笼平,卻偏偏與公主長得像,于是被迫代替她去往敵國和親舔痪。 傳聞我的和親對象是個(gè)殘疾皇子寓调,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容