筆記 | 知識圖譜原理溪窒、流程與應(yīng)用

本文為純筆記梳理,旨在入門學(xué)習(xí)知識圖譜冯勉,基于原理與流程澈蚌,幫助理解知識圖譜商業(yè)化落地的價值與可能性。

梳理內(nèi)容包括:

1. 知識圖譜(Knowledge Graph灼狰,KG)是什么

2. 如何構(gòu)建知識圖譜:一個流程

3. 知識圖譜的重要性:從孤立數(shù)據(jù)宛瞄、單點(diǎn)知識,到結(jié)構(gòu)化知識體系和認(rèn)知模型

4. 知識圖譜的應(yīng)用場景

5. 知識圖譜在教育的落地:一些實(shí)例

1. 知識圖譜是什么交胚?

知識圖譜最先在2012年由Google提出份汗,用以描述其搜索引擎從不同來源獲得的信息結(jié)果。這些信息的結(jié)果本質(zhì)是一個多關(guān)系圖(Multi-relational Graph)蝴簇,由不同的信息(節(jié)點(diǎn))+關(guān)系(邊)構(gòu)成杯活。


來源:機(jī)器之心

2. 知識圖譜的構(gòu)建流程

在構(gòu)建知識圖譜之前,要先確定是否需要知識圖譜來支持的業(yè)務(wù)問題军熏,否則傳統(tǒng)的數(shù)據(jù)庫也可以完成分析轩猩。

知識圖譜的基礎(chǔ)構(gòu)建流程,分為5個主要步驟:

(1) 定義具體的業(yè)務(wù)問題 ( 2) 數(shù)據(jù)的收集 & 預(yù)處理? (3) 知識圖譜的設(shè)計(jì) ( 4) 把數(shù)據(jù)存入知識圖譜? (5)上層應(yīng)用的開發(fā),以及系統(tǒng)的評估均践。

其中晤锹,在(3)知識圖譜設(shè)計(jì),知識圖譜包含節(jié)點(diǎn)(實(shí)體)彤委、邊(關(guān)系)和屬性鞭铆,在設(shè)計(jì)時,構(gòu)建者需要處理:

? ? - 需要什么實(shí)體焦影、關(guān)系和屬性

? ? - 哪些屬性可以作為實(shí)體车遂,哪些實(shí)體可以作為屬性

? ? - 哪些信息不需要放到知識圖譜

處理是可以參考的原則:業(yè)務(wù)原則、分析原則斯辰、效率原則舶担、冗余原則。(在此處不會細(xì)展開相關(guān)內(nèi)容彬呻,本文暫時的目的在于對知識圖譜入門并形成一個基礎(chǔ)的落地框架認(rèn)識衣陶,更細(xì)的內(nèi)容在后續(xù)學(xué)習(xí)再展開)

(4)數(shù)據(jù)存入知識圖譜,是基于設(shè)計(jì)模型做出的限定/范圍闸氮,再將對應(yīng)數(shù)據(jù)放入知識圖譜剪况,簡單理解就是使框架獲得數(shù)據(jù)填充。

(5)上層應(yīng)用開發(fā)

? ? - 基于規(guī)則的場景:方法論包括不一致性驗(yàn)證蒲跨、基于規(guī)則提取特征译断、基于模式的判斷。(具體有待進(jìn)一步學(xué)習(xí)展開)

? ? - 基于概率的場景:基于概率的方法包括社區(qū)挖掘或悲、標(biāo)簽傳播孙咪、聚類等技術(shù)。

? ? - 基于動態(tài)網(wǎng)絡(luò)的分析

值得注意的是巡语,知識圖譜由場景驅(qū)動该贾,有場景才有生產(chǎn)/構(gòu)建數(shù)據(jù)的可能,然后將數(shù)據(jù)加入知識圖譜框架中捌臊。所以知識圖譜的構(gòu)建前提是具備應(yīng)用場景。具備場景兜材、盤活數(shù)據(jù)后理澎,算法對數(shù)據(jù)/實(shí)體/節(jié)點(diǎn)與關(guān)系進(jìn)行處理,進(jìn)而加工數(shù)據(jù)曙寡。

3. 知識圖譜的重要性是什么糠爬?

從數(shù)據(jù)到知識體系、認(rèn)知能力構(gòu)建

文首就提及知識圖譜由Google2012年提出举庶,Google基于知識圖譜優(yōu)化搜索結(jié)果执隧。2013年,Google收購自然語言處理技術(shù)公司W(wǎng)avii,將后者技術(shù)與Google Knowledge Graph整合镀琉。2015年谷歌推出醫(yī)療版知識圖譜÷袜停現(xiàn)在谷歌語音搜索、Google Assistant屋摔、Google Lens烁设、Google Home諸多軟硬件產(chǎn)品均已接入谷歌知識圖譜。

2017年百度曾表示:“知識圖譜(包括需求圖譜钓试、用戶畫像等等)装黑,這些東西都是百度整個人工智能當(dāng)中非常基礎(chǔ)的構(gòu)件弓熏,也是我們相對于其他任何一家公司的優(yōu)勢所在恋谭。”

“構(gòu)建知識圖譜這個過程的本質(zhì)挽鞠,就是讓機(jī)器形成認(rèn)知能力疚颊,理解這個世界。事實(shí)上滞谢,現(xiàn)在機(jī)器的感知能力已經(jīng)越來越接近于人類了串稀,語音識別準(zhǔn)確率達(dá)到97%甚至更高,圖像識別某些領(lǐng)域如人臉識別狮杨,比人類個體更加準(zhǔn)確和迅速母截。所以,未來人工智能的重點(diǎn)進(jìn)步方向?qū)⑹钦J(rèn)知層橄教,機(jī)器理解這個世界清寇,才能更好地與世界交互,為人類服務(wù)护蝶』蹋”

大公司在嘗試將數(shù)據(jù)轉(zhuǎn)化成具備結(jié)構(gòu)/規(guī)則可連接的多關(guān)系圖譜,通俗解釋其意義在于:讓機(jī)器獲得從點(diǎn)到面到全網(wǎng)立體的知識網(wǎng)絡(luò)結(jié)構(gòu)持灰,其可以實(shí)現(xiàn)的基本結(jié)果——可以想象下我們個人學(xué)習(xí)一個個知識點(diǎn)盔夜、概念之后,將點(diǎn)連成線堤魁、面乃至更豐滿的知識體系的效用喂链。

假設(shè)在教育領(lǐng)域,不難想象妥泉,單個知識點(diǎn)或者單條學(xué)習(xí)路徑椭微,通過構(gòu)建知識圖譜,使得知識點(diǎn)之間具備多關(guān)系盲链,機(jī)器通過知識圖譜無論在上游學(xué)習(xí)路徑的構(gòu)建蝇率、下游對學(xué)習(xí)者學(xué)習(xí)水平測評都有可識別迟杂、可判斷的依據(jù)(規(guī)則),進(jìn)而形成立體的本慕、個性化的學(xué)習(xí)體系推薦排拷。這方面和我上一篇筆記中,對自適應(yīng)學(xué)習(xí)在內(nèi)容體系间狂、測評攻泼、練習(xí)中即有體現(xiàn)。

4. 知識圖譜到底有哪些應(yīng)用場景鉴象?

知識圖譜概念起源于Google的搜索相關(guān)忙菠,其對應(yīng)應(yīng)用在于搜索》谋祝基于其底層原理及(業(yè)務(wù)定義-數(shù)據(jù)預(yù)處理-圖譜設(shè)計(jì)/定義關(guān)系-存入數(shù)據(jù)-應(yīng)用層開發(fā))流程來看牛欢,不難判斷,只有存在數(shù)據(jù)與可被定義關(guān)系的場景都可以應(yīng)用到知識圖譜——可以說是甚為廣泛淆游,比如教育傍睹、金融、醫(yī)療犹菱、信息推薦以及傳統(tǒng)工業(yè)(一旦數(shù)據(jù)線上化拾稳,將會有非常多可以進(jìn)一步探索的)等等。

5. 知識圖譜在教育的落地

在教育領(lǐng)域腊脱,知識圖譜構(gòu)建后访得,很多時候與上一文章提到的自適應(yīng)學(xué)習(xí)是相關(guān)聯(lián)的。兩者的關(guān)系陕凹,我的理解是悍抑,知識圖譜是數(shù)據(jù)與關(guān)系/規(guī)則前提,是基礎(chǔ)杜耙,自適應(yīng)學(xué)習(xí)更多是基于算法模型搜骡,使得知識圖譜得以應(yīng)用:盤活知識圖譜的節(jié)點(diǎn),使其基于規(guī)則/先定關(guān)系為學(xué)習(xí)者提供個性化的學(xué)習(xí)/練習(xí)/測評內(nèi)容佑女。

如果是從一個大的框架去定義教育行業(yè)對知識圖譜的角色记靡,我目前的理解是,總體而言团驱,無論在哪個細(xì)分賽道簸呈,知識圖譜的構(gòu)建原理和流程差異不大。

在落地上店茶,國內(nèi)構(gòu)建知識圖譜應(yīng)用在教育領(lǐng)域的項(xiàng)目包括乂學(xué)教育、作業(yè)盒子劫恒、洋蔥數(shù)學(xué)贩幻、盒子魚轿腺、學(xué)吧課堂、猿輔導(dǎo)丛楚、一起學(xué)習(xí)等等族壳。

以下舉兩個應(yīng)用實(shí)例,以及對應(yīng)使用知識圖譜的邏輯趣些。

乂學(xué)教育/松鼠AI

松鼠AI是面向中小學(xué)全學(xué)科在線輔導(dǎo)平臺仿荆。其目標(biāo)在于通過自適應(yīng)系統(tǒng),基于學(xué)生在線學(xué)習(xí)/測評情況坏平,掃描學(xué)生知識漏洞拢操,個性化查漏補(bǔ)缺。松鼠AI的自適應(yīng)學(xué)習(xí)系統(tǒng)舶替,主要基于四個理論體系令境,

“第一個叫做知識空間理論。把知識根據(jù)難易程度顾瞪、重要性舔庶、認(rèn)知層次進(jìn)行分級,對學(xué)習(xí)內(nèi)容建模陈醒,構(gòu)建“知識圖譜”惕橙,梳理知識點(diǎn)間的邏輯和認(rèn)知相關(guān)關(guān)系”。

在這里钉跷,難易弥鹦、重要性、認(rèn)知層級尘应,是上文提及的業(yè)務(wù)惶凝、節(jié)點(diǎn)關(guān)系定義相關(guān)。

盒子魚

盒子魚是一個中小學(xué)到高中犬钢、大學(xué)托福雅思等英語智能學(xué)習(xí)平臺苍鲜。基于學(xué)習(xí)內(nèi)容,盒子魚將知識點(diǎn)構(gòu)建成知識圖譜玷犹,知識圖譜形成后混滔,對學(xué)習(xí)者可以進(jìn)行個性化的學(xué)習(xí)、測評歹颓、乃至下一步的智能輔導(dǎo)服務(wù)坯屿。

------

以上,是一個初步梳理巍扛,僅對KG有一個框架了解领跛。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市撤奸,隨后出現(xiàn)的幾起案子吠昭,更是在濱河造成了極大的恐慌喊括,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件矢棚,死亡現(xiàn)場離奇詭異郑什,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)蒲肋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進(jìn)店門蘑拯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人兜粘,你說我怎么就攤上這事申窘。” “怎么了妹沙?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵偶洋,是天一觀的道長。 經(jīng)常有香客問我距糖,道長玄窝,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任悍引,我火速辦了婚禮恩脂,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘趣斤。我一直安慰自己俩块,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布浓领。 她就那樣靜靜地躺著玉凯,像睡著了一般。 火紅的嫁衣襯著肌膚如雪联贩。 梳的紋絲不亂的頭發(fā)上漫仆,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天,我揣著相機(jī)與錄音泪幌,去河邊找鬼盲厌。 笑死,一個胖子當(dāng)著我的面吹牛祸泪,可吹牛的內(nèi)容都是我干的吗浩。 我是一名探鬼主播,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼没隘,長吁一口氣:“原來是場噩夢啊……” “哼懂扼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起右蒲,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤微王,失蹤者是張志新(化名)和其女友劉穎屡限,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體炕倘,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年翰撑,在試婚紗的時候發(fā)現(xiàn)自己被綠了罩旋。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡眶诈,死狀恐怖涨醋,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情逝撬,我是刑警寧澤浴骂,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站宪潮,受9級特大地震影響溯警,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜狡相,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一梯轻、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧尽棕,春花似錦喳挑、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至回官,卻和暖如春曹宴,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背孙乖。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工浙炼, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人唯袄。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓弯屈,卻偏偏與公主長得像,于是被迫代替她去往敵國和親恋拷。 傳聞我的和親對象是個殘疾皇子资厉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評論 2 345