知識圖譜相關(guān)學(xué)習(xí)資料大全

awesome-knowledge-graph

整理知識圖譜相關(guān)學(xué)習(xí)資料,提供系統(tǒng)化的知識圖譜學(xué)習(xí)路徑。

目錄

理論及論文

整體概念架構(gòu)

隨著知識圖譜的發(fā)展,與之相關(guān)的概念也越來越多胰苏,在閱讀論文時先準(zhǔn)確的把握該論文所要解決問題處于的層級或者位置對于更好的理解論文也比較有幫助,在此對知識圖譜的概念進(jìn)行了總結(jié)整理,整體概念架構(gòu)圖如下圖所示哟旗,后面的論文分類也按照該整體架構(gòu)概念圖從頂向下,從整體到細(xì)節(jié)的方式組織栋操。

綜述綜合

大綜述

Knowledge-Augmented LMs(知識增強(qiáng)語言模型)

知識圖譜增強(qiáng)語言模型是最近兩年比較流行地淀,主要發(fā)生在BERT出來之后失球,將知識先驗(yàn)信息融入到語言模型,可以說是知識圖譜助力NLP十分關(guān)鍵的一環(huán)帮毁,將該專題放在比較靠前的位置实苞。

常識圖譜(Commonsense)

目前人工智能在很多方面表現(xiàn)的比較智障的原因摆舟,很多學(xué)者仍為是由于AI缺乏基本常識知識的原因亥曹,因此,從感知智能到認(rèn)知智能常識知識起著很重要的作用恨诱,而常識圖譜作為常識知識的一個重要表示手段也越來越受到重視媳瞪。

知識應(yīng)用

對話系統(tǒng)

知識圖譜落地應(yīng)用最為廣泛的一個方向瞳腌,研究人數(shù)也眾多,個人覺得在工業(yè)界可發(fā)揮的空間比較大镜雨。

知識庫問答-KBQA

推薦系統(tǒng)

  • Multi-modal Knowledge Graphs for Recommender Systems(CIKM 2020)[將多模態(tài)信息引入知識圖譜推薦各淀,整體結(jié)構(gòu)上包括多模態(tài)知識圖譜graph embedding和recommendation兩部分懒鉴,其中g(shù)raph embedding包括entity encoder和attention,用于綜合表示節(jié)點(diǎn)以及其周圍節(jié)點(diǎn)信息碎浇。]

知識計算

Representation(知識表示)

知識應(yīng)用的基礎(chǔ)临谱,目前分布式表示或者embedding大有一統(tǒng)江湖的意思,各種花式embedding眼花繚亂奴璃。

Reasoning(知識推理)

聽起來高大上的方向氏豌,實(shí)際落地感覺很不容易喉酌,學(xué)術(shù)界發(fā)paper可能還行,但是在工業(yè)界容易跪泵喘,要推理也盡量離線展開泪电,不要在線推理。

KG Completion(圖譜補(bǔ)全)

Coreference Resolution(指代消解)

知識獲取

NER(命名實(shí)體識別)

也是自然語言處理的基礎(chǔ)任務(wù),十分重要生真。

Entity aligning(實(shí)體對齊)

Coreference Resolution(指代消解)

知識建模

Taxonomy(本體構(gòu)建)

其他擴(kuò)展

Tracing(知識追蹤)

本類別并不是傳統(tǒng)知識圖譜中的任務(wù)术瓮,而是與教育領(lǐng)域結(jié)合的廣義上的知識圖譜任務(wù)康聂。

圖譜及數(shù)據(jù)集

開放知識圖譜

中文開放知識圖譜(OpenKG.CN)

中文開放知識圖譜(簡稱OpenKG.CN)旨在促進(jìn)中文知識圖譜數(shù)據(jù)的開放與互聯(lián),促進(jìn)知識圖譜和語義技術(shù)的普及和廣泛應(yīng)用胞四,包括了眾多的數(shù)據(jù)集以及工具恬汁。

領(lǐng)域知識圖譜

學(xué)術(shù)知識圖譜AceKG

最新發(fā)布的Acemap知識圖譜(AceKG)描述了超過1億個學(xué)術(shù)實(shí)體、22億條三元組信息撬讽,涵蓋了全面的學(xué)術(shù)信息蕊连。具體而言,AceKG包含了61,704,089篇paper游昼、52,498,428位學(xué)者甘苍、50,233個研究領(lǐng)域、19,843個學(xué)術(shù)研究機(jī)構(gòu)烘豌、22,744個學(xué)術(shù)期刊载庭、1,278個學(xué)術(shù)會議以及3個學(xué)術(shù)聯(lián)盟(如C9聯(lián)盟)。

同時廊佩,AceKG也為每個實(shí)體提供了豐富的屬性信息囚聚,在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的基礎(chǔ)上加上語義信息,旨在為眾多學(xué)術(shù)大數(shù)據(jù)挖掘項目提供全面支持标锄。

數(shù)據(jù)集

SQuAD

YAGO

YAGO是由德國馬普研究所研制的鏈接數(shù)據(jù)庫顽铸。YAGO主要集成了Wikipedia、WordNet和GeoNames三個來源的數(shù)據(jù)料皇。YAGO將WordNet的詞匯定義與Wikipedia的分類體系進(jìn)行了融合集成谓松,使得YAGO具有更加豐富的實(shí)體分類體系。YAGO還考慮了時間和空間知識践剂,為很多知識條目增加了時間和空間維度的屬性描述鬼譬。目前,YAGO包含1.2億條三元組知識逊脯。YAGO是IBM Watson的后端知識庫之一优质。由于完成的YAGO數(shù)據(jù)集過于龐大,在使用過程中經(jīng)常會選取其中一部分進(jìn)行军洼,比如可以抽取中帶有時間注釋(time annotations)的部分形成YAGO11k數(shù)據(jù)集巩螃。

WikiData

WikiData的目標(biāo)是構(gòu)建一個免費(fèi)開放、多語言匕争、任何人或機(jī)器都可以編輯修改的大規(guī)模鏈接知識庫牺六。WikiData由維基百科于2012年啟動,早期得到微軟聯(lián)合創(chuàng)始人Paul Allen汗捡、Gordon Betty Moore基金會以及Google的聯(lián)合資助淑际。WikiData繼承了Wikipedia的眾包協(xié)作的機(jī)制,但與Wikipedia不同扇住,WikiData支持的是以三元組為基礎(chǔ)的知識條目(Items)的自由編輯春缕。一個三元組代表一個關(guān)于該條目的陳述(Statements)。

NLPCC 2017 KBQA

該任務(wù)來自NLPCC 2017評測任務(wù)艘蹋,開放域問答評價任務(wù)主要包括三項子任務(wù)锄贼,基于知識庫的問答(kbqa),基于文檔的問答(dbqa)女阀,和基于表的問答(tbqa)宅荤。kbqa的任務(wù)是基于知識庫的中文問題回答屑迂。dbqa的任務(wù)是通過選擇一個或多個句子從一個給定的文檔,作為答案回答中文問題冯键。tbqa的任務(wù)是一個全新的QA任務(wù)惹盼,旨在通過從收集的表格中抽取一個或多個表回答英語問題。

下載鏈接

GDELT

GDELT(Global Database of Events, Language, and Tone)是最大的綜合人類社會關(guān)系數(shù)據(jù)庫惫确,以100多種語言監(jiān)控來自每個國家?guī)缀趺總€角落的廣播手报、印刷和網(wǎng)絡(luò)新聞,并確定推動我們?nèi)蛏鐣娜烁幕⒌攸c(diǎn)掩蛤、組織、主題陈肛、來源揍鸟、情感、計數(shù)句旱、報價蜈亩、圖像和事件每天的每一秒,它的全球知識圖將世界的人前翎,組織稚配,地點(diǎn),主題港华,計數(shù)道川,圖像和情感連接到整個地球上的單一整體網(wǎng)絡(luò)。為整個世界的計算創(chuàng)建一個免費(fèi)的開放平臺立宜。

下載鏈接

ICEWS

ICEWS(Integrated Crisis Early Warning System)捕獲和處理來自數(shù)字化新聞媒體冒萄,社交媒體和其他來源的數(shù)百萬條數(shù)據(jù),以預(yù)測橙数,跟蹤和響應(yīng)世界各地的事件尊流,主要用于早期預(yù)警。該數(shù)據(jù)集在知識圖譜領(lǐng)域主要用于動態(tài)事件預(yù)測等動態(tài)圖譜方面灯帮。

下載鏈接

OAG

OAG(Open Academic Graph包含來自MAG的166,192,182篇論文和來自AMiner的154,771,162篇論文崖技,并生成了兩個圖之間的64,639,608個鏈接(匹配)關(guān)系。它可以作為研究引文網(wǎng)絡(luò)钟哥,論文內(nèi)容等的統(tǒng)一大型學(xué)術(shù)圖表迎献,也可以用于研究多個學(xué)術(shù)圖表的整合。

下載鏈接

工具

根據(jù)知識圖譜的通用基本構(gòu)建流程為依據(jù)腻贰,每個階段都整理部分工具吁恍。

知識建模

知識抽取

Deepdive

知識推理

知識表示

OpenKE

清華大學(xué)NLP實(shí)驗(yàn)室基于TensorFlow開發(fā)的知識嵌入平臺,實(shí)現(xiàn)了大部分知識表示學(xué)習(xí)方法。

知識融合

白皮書及報告

機(jī)構(gòu)及人物

本部分介紹在知識圖譜領(lǐng)域前沿研究或者有一定影響力的機(jī)構(gòu)以及個人冀瓦。

機(jī)構(gòu)

人物

視頻課程

小象學(xué)院知識圖譜課程

貪心學(xué)院知識圖譜課程

煉數(shù)成金知識圖譜課程

CSDN視頻課

專欄合集

知乎集合

簡書集合

評測競賽

會議交流及講座

AICon

BDTC

其他

項目案例

教育領(lǐng)域知識圖譜

金融領(lǐng)域知識圖譜

利用網(wǎng)絡(luò)上公開的數(shù)據(jù)構(gòu)建一個小型的證券知識圖譜/知識庫

  • https://github.com/lemonhu/stock-knowledge-graph.git

上市公司高管圖譜

  • https://github.com/Shuang0420/knowledge_graph_demo

醫(yī)療領(lǐng)域知識圖譜

農(nóng)業(yè)領(lǐng)域知識圖譜

使用爬蟲獲取Wikidata數(shù)據(jù)構(gòu)建

  • https://github.com/CrisJk/Agriculture-KnowledgeGraph-Data.git

知識工程領(lǐng)域知識圖譜

其他知識圖譜

紅樓夢人物關(guān)系圖譜

  • https://github.com/chizhu/KGQA_HLM

通用領(lǐng)域知識圖譜

  • https://github.com/Pelhans/Z_knowledge_graph

免費(fèi)1.5億實(shí)體通用領(lǐng)域知識圖譜

  • https://github.com/ownthink/KnowledgeGraph

簡易電影領(lǐng)域知識圖譜及KBQA系統(tǒng)

  • https://github.com/SimmerChan/KG-demo-for-movie

推廣技術(shù)文章

2020

2019

2018

2017

2016

本文使用 文章同步助手 同步

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末腔呜,一起剝皮案震驚了整個濱河市叁温,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌核畴,老刑警劉巖膝但,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異谤草,居然都是意外死亡跟束,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進(jìn)店門丑孩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來泳炉,“玉大人,你說我怎么就攤上這事嚎杨』ǘ欤” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵枫浙,是天一觀的道長刨肃。 經(jīng)常有香客問我古拴,道長,這世上最難降的妖魔是什么真友? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任黄痪,我火速辦了婚禮,結(jié)果婚禮上盔然,老公的妹妹穿的比我還像新娘桅打。我一直安慰自己,他們只是感情好愈案,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布挺尾。 她就那樣靜靜地躺著,像睡著了一般站绪。 火紅的嫁衣襯著肌膚如雪遭铺。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天恢准,我揣著相機(jī)與錄音魂挂,去河邊找鬼。 笑死馁筐,一個胖子當(dāng)著我的面吹牛涂召,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播敏沉,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼芹扭,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了赦抖?” 一聲冷哼從身側(cè)響起舱卡,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎队萤,沒想到半個月后轮锥,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡要尔,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年舍杜,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赵辕。...
    茶點(diǎn)故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡既绩,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出还惠,到底是詐尸還是另有隱情饲握,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站救欧,受9級特大地震影響衰粹,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜笆怠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一铝耻、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蹬刷,春花似錦瓢捉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至诈火,卻和暖如春兽赁,著一層夾襖步出監(jiān)牢的瞬間状答,已是汗流浹背冷守。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留惊科,地道東北人拍摇。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像馆截,于是被迫代替她去往敵國和親充活。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容