知識圖譜本質(zhì) :是語義網(wǎng)絡(luò)知識庫,包含有:有向圖結(jié)構(gòu)、結(jié)點(diǎn)代表實(shí)體或概念、邊代表實(shí)體/概念之間的語義關(guān)系
知識圖譜的發(fā)展:從20世紀(jì)五六十年代提出語義網(wǎng)絡(luò)擎颖,20世紀(jì)70年代-語義網(wǎng)絡(luò)和一階邏輯謂詞的關(guān)系,20世紀(jì)80年代-語義網(wǎng)絡(luò)理論完善(語義推理)观游,20世紀(jì)90年代到概念關(guān)系建模搂捧,再到21世紀(jì)-新的應(yīng)用場景語義web:通過W3C的標(biāo)準(zhǔn)拓展web,實(shí)現(xiàn)數(shù)據(jù)在不同應(yīng)用中的共享和重用懂缕,用戶上傳各種圖結(jié)構(gòu)的數(shù)據(jù)(W3C的標(biāo)準(zhǔn)RDF)形成連接數(shù)據(jù)最后2012年谷歌提出知識圖譜(knowledge graph)概念允跑。
知識圖譜相比早期語義網(wǎng)絡(luò):KG強(qiáng)調(diào)實(shí)體之間的關(guān)聯(lián),KG強(qiáng)調(diào)實(shí)體的屬性值搪柑,KG概念的層次關(guān)系比實(shí)體之間的關(guān)系的數(shù)量少很多聋丝,早期的語義網(wǎng)絡(luò)主要用于對自然語言的句子做表示構(gòu)建方式不同:KG的主要來源是百科(尤其半結(jié)構(gòu)化的數(shù)據(jù))、早期語義網(wǎng)絡(luò)主要靠人工構(gòu)建工碾、KG通過知識挖掘技術(shù)實(shí)現(xiàn)快速構(gòu)建大規(guī)模高質(zhì)量的知識圖譜弱睦、KG的構(gòu)建強(qiáng)調(diào)不同來源知識的融合和清洗。
與本體標(biāo)準(zhǔn)語言的區(qū)別是:本身不具備形式化語言渊额、利用RDFS或OWL推理具備形式化語義况木、也不是所有的OWL本體都適合轉(zhuǎn)換成KG。
知識圖譜的構(gòu)建技術(shù):KG的技術(shù)地圖包含有:
①:知識獲妊!:機(jī)構(gòu)化數(shù)據(jù)(ETL工具)火惊、半結(jié)構(gòu)化數(shù)據(jù)(包裝器學(xué)習(xí)抽取規(guī)則)、非結(jié)構(gòu)化數(shù)據(jù)(NLP技術(shù))
②:數(shù)據(jù)融合:本體構(gòu)建及管理奔垦、數(shù)據(jù)映射屹耐、實(shí)體匹配、本體融合宴倍、知識存儲(NoSQL或RDB)张症、分布式算(SPARK或Hadoop)
③:知識計(jì)算及應(yīng)用