本文為純筆記梳理,旨在入門學(xué)習(xí)知識圖譜冯勉,基于原理與流程澈蚌,幫助理解知識圖譜商業(yè)化落地的價值與可能性。
梳理內(nèi)容包括:
1. 知識圖譜(Knowledge Graph灼狰,KG)是什么
2. 如何構(gòu)建知識圖譜:一個流程
3. 知識圖譜的重要性:從孤立數(shù)據(jù)宛瞄、單點(diǎn)知識,到結(jié)構(gòu)化知識體系和認(rèn)知模型
4. 知識圖譜的應(yīng)用場景
5. 知識圖譜在教育的落地:一些實(shí)例
1. 知識圖譜是什么交胚?
知識圖譜最先在2012年由Google提出份汗,用以描述其搜索引擎從不同來源獲得的信息結(jié)果。這些信息的結(jié)果本質(zhì)是一個多關(guān)系圖(Multi-relational Graph)蝴簇,由不同的信息(節(jié)點(diǎn))+關(guān)系(邊)構(gòu)成杯活。
2. 知識圖譜的構(gòu)建流程
在構(gòu)建知識圖譜之前,要先確定是否需要知識圖譜來支持的業(yè)務(wù)問題军熏,否則傳統(tǒng)的數(shù)據(jù)庫也可以完成分析轩猩。
知識圖譜的基礎(chǔ)構(gòu)建流程,分為5個主要步驟:
(1) 定義具體的業(yè)務(wù)問題 ( 2) 數(shù)據(jù)的收集 & 預(yù)處理? (3) 知識圖譜的設(shè)計(jì) ( 4) 把數(shù)據(jù)存入知識圖譜? (5)上層應(yīng)用的開發(fā),以及系統(tǒng)的評估均践。
其中晤锹,在(3)知識圖譜設(shè)計(jì),知識圖譜包含節(jié)點(diǎn)(實(shí)體)彤委、邊(關(guān)系)和屬性鞭铆,在設(shè)計(jì)時,構(gòu)建者需要處理:
? ? - 需要什么實(shí)體焦影、關(guān)系和屬性
? ? - 哪些屬性可以作為實(shí)體车遂,哪些實(shí)體可以作為屬性
? ? - 哪些信息不需要放到知識圖譜
處理是可以參考的原則:業(yè)務(wù)原則、分析原則斯辰、效率原則舶担、冗余原則。(在此處不會細(xì)展開相關(guān)內(nèi)容彬呻,本文暫時的目的在于對知識圖譜入門并形成一個基礎(chǔ)的落地框架認(rèn)識衣陶,更細(xì)的內(nèi)容在后續(xù)學(xué)習(xí)再展開)
(4)數(shù)據(jù)存入知識圖譜,是基于設(shè)計(jì)模型做出的限定/范圍闸氮,再將對應(yīng)數(shù)據(jù)放入知識圖譜剪况,簡單理解就是使框架獲得數(shù)據(jù)填充。
(5)上層應(yīng)用開發(fā)
? ? - 基于規(guī)則的場景:方法論包括不一致性驗(yàn)證蒲跨、基于規(guī)則提取特征译断、基于模式的判斷。(具體有待進(jìn)一步學(xué)習(xí)展開)
? ? - 基于概率的場景:基于概率的方法包括社區(qū)挖掘或悲、標(biāo)簽傳播孙咪、聚類等技術(shù)。
? ? - 基于動態(tài)網(wǎng)絡(luò)的分析
值得注意的是巡语,知識圖譜由場景驅(qū)動该贾,有場景才有生產(chǎn)/構(gòu)建數(shù)據(jù)的可能,然后將數(shù)據(jù)加入知識圖譜框架中捌臊。所以知識圖譜的構(gòu)建前提是具備應(yīng)用場景。具備場景兜材、盤活數(shù)據(jù)后理澎,算法對數(shù)據(jù)/實(shí)體/節(jié)點(diǎn)與關(guān)系進(jìn)行處理,進(jìn)而加工數(shù)據(jù)曙寡。
3. 知識圖譜的重要性是什么糠爬?
從數(shù)據(jù)到知識體系、認(rèn)知能力構(gòu)建
文首就提及知識圖譜由Google2012年提出举庶,Google基于知識圖譜優(yōu)化搜索結(jié)果执隧。2013年,Google收購自然語言處理技術(shù)公司W(wǎng)avii,將后者技術(shù)與Google Knowledge Graph整合镀琉。2015年谷歌推出醫(yī)療版知識圖譜÷袜停現(xiàn)在谷歌語音搜索、Google Assistant屋摔、Google Lens烁设、Google Home諸多軟硬件產(chǎn)品均已接入谷歌知識圖譜。
2017年百度曾表示:“知識圖譜(包括需求圖譜钓试、用戶畫像等等)装黑,這些東西都是百度整個人工智能當(dāng)中非常基礎(chǔ)的構(gòu)件弓熏,也是我們相對于其他任何一家公司的優(yōu)勢所在恋谭。”
“構(gòu)建知識圖譜這個過程的本質(zhì)挽鞠,就是讓機(jī)器形成認(rèn)知能力疚颊,理解這個世界。事實(shí)上滞谢,現(xiàn)在機(jī)器的感知能力已經(jīng)越來越接近于人類了串稀,語音識別準(zhǔn)確率達(dá)到97%甚至更高,圖像識別某些領(lǐng)域如人臉識別狮杨,比人類個體更加準(zhǔn)確和迅速母截。所以,未來人工智能的重點(diǎn)進(jìn)步方向?qū)⑹钦J(rèn)知層橄教,機(jī)器理解這個世界清寇,才能更好地與世界交互,為人類服務(wù)护蝶』蹋”
大公司在嘗試將數(shù)據(jù)轉(zhuǎn)化成具備結(jié)構(gòu)/規(guī)則可連接的多關(guān)系圖譜,通俗解釋其意義在于:讓機(jī)器獲得從點(diǎn)到面到全網(wǎng)立體的知識網(wǎng)絡(luò)結(jié)構(gòu)持灰,其可以實(shí)現(xiàn)的基本結(jié)果——可以想象下我們個人學(xué)習(xí)一個個知識點(diǎn)盔夜、概念之后,將點(diǎn)連成線堤魁、面乃至更豐滿的知識體系的效用喂链。
假設(shè)在教育領(lǐng)域,不難想象妥泉,單個知識點(diǎn)或者單條學(xué)習(xí)路徑椭微,通過構(gòu)建知識圖譜,使得知識點(diǎn)之間具備多關(guān)系盲链,機(jī)器通過知識圖譜無論在上游學(xué)習(xí)路徑的構(gòu)建蝇率、下游對學(xué)習(xí)者學(xué)習(xí)水平測評都有可識別迟杂、可判斷的依據(jù)(規(guī)則),進(jìn)而形成立體的本慕、個性化的學(xué)習(xí)體系推薦排拷。這方面和我上一篇筆記中,對自適應(yīng)學(xué)習(xí)在內(nèi)容體系间狂、測評攻泼、練習(xí)中即有體現(xiàn)。
4. 知識圖譜到底有哪些應(yīng)用場景鉴象?
知識圖譜概念起源于Google的搜索相關(guān)忙菠,其對應(yīng)應(yīng)用在于搜索》谋祝基于其底層原理及(業(yè)務(wù)定義-數(shù)據(jù)預(yù)處理-圖譜設(shè)計(jì)/定義關(guān)系-存入數(shù)據(jù)-應(yīng)用層開發(fā))流程來看牛欢,不難判斷,只有存在數(shù)據(jù)與可被定義關(guān)系的場景都可以應(yīng)用到知識圖譜——可以說是甚為廣泛淆游,比如教育傍睹、金融、醫(yī)療犹菱、信息推薦以及傳統(tǒng)工業(yè)(一旦數(shù)據(jù)線上化拾稳,將會有非常多可以進(jìn)一步探索的)等等。
5. 知識圖譜在教育的落地
在教育領(lǐng)域腊脱,知識圖譜構(gòu)建后访得,很多時候與上一文章提到的自適應(yīng)學(xué)習(xí)是相關(guān)聯(lián)的。兩者的關(guān)系陕凹,我的理解是悍抑,知識圖譜是數(shù)據(jù)與關(guān)系/規(guī)則前提,是基礎(chǔ)杜耙,自適應(yīng)學(xué)習(xí)更多是基于算法模型搜骡,使得知識圖譜得以應(yīng)用:盤活知識圖譜的節(jié)點(diǎn),使其基于規(guī)則/先定關(guān)系為學(xué)習(xí)者提供個性化的學(xué)習(xí)/練習(xí)/測評內(nèi)容佑女。
如果是從一個大的框架去定義教育行業(yè)對知識圖譜的角色记靡,我目前的理解是,總體而言团驱,無論在哪個細(xì)分賽道簸呈,知識圖譜的構(gòu)建原理和流程差異不大。
在落地上店茶,國內(nèi)構(gòu)建知識圖譜應(yīng)用在教育領(lǐng)域的項(xiàng)目包括乂學(xué)教育、作業(yè)盒子劫恒、洋蔥數(shù)學(xué)贩幻、盒子魚轿腺、學(xué)吧課堂、猿輔導(dǎo)丛楚、一起學(xué)習(xí)等等族壳。
以下舉兩個應(yīng)用實(shí)例,以及對應(yīng)使用知識圖譜的邏輯趣些。
乂學(xué)教育/松鼠AI
松鼠AI是面向中小學(xué)全學(xué)科在線輔導(dǎo)平臺仿荆。其目標(biāo)在于通過自適應(yīng)系統(tǒng),基于學(xué)生在線學(xué)習(xí)/測評情況坏平,掃描學(xué)生知識漏洞拢操,個性化查漏補(bǔ)缺。松鼠AI的自適應(yīng)學(xué)習(xí)系統(tǒng)舶替,主要基于四個理論體系令境,
“第一個叫做知識空間理論。把知識根據(jù)難易程度顾瞪、重要性舔庶、認(rèn)知層次進(jìn)行分級,對學(xué)習(xí)內(nèi)容建模陈醒,構(gòu)建“知識圖譜”惕橙,梳理知識點(diǎn)間的邏輯和認(rèn)知相關(guān)關(guān)系”。
在這里钉跷,難易弥鹦、重要性、認(rèn)知層級尘应,是上文提及的業(yè)務(wù)惶凝、節(jié)點(diǎn)關(guān)系定義相關(guān)。
盒子魚
盒子魚是一個中小學(xué)到高中犬钢、大學(xué)托福雅思等英語智能學(xué)習(xí)平臺苍鲜。基于學(xué)習(xí)內(nèi)容,盒子魚將知識點(diǎn)構(gòu)建成知識圖譜玷犹,知識圖譜形成后混滔,對學(xué)習(xí)者可以進(jìn)行個性化的學(xué)習(xí)、測評歹颓、乃至下一步的智能輔導(dǎo)服務(wù)坯屿。
------
以上,是一個初步梳理巍扛,僅對KG有一個框架了解领跛。