人工智能技術分為感知智能和認知智能兩類礁遣,當前歷史階段寺擂,人工智能還處于感知智能階段愉粤,人工智能擅長分類和識別砾医,但不擅長推理、分析等認知智能所包含的能力衣厘。知識圖譜被稱為新一代人工智能的基礎設施如蚜,基于知識圖譜可實現(xiàn)各種上層的知識應用,使機器具備推理影暴、預測错邦、分析等能力,對于想提供更佳用戶體驗和服務的產(chǎn)品經(jīng)理來講型宙,了解和學習知識圖譜十分必要撬呢。本篇談談產(chǎn)品經(jīng)理如何入門知識圖譜。
獲取知識的痛點
大眾通常獲取知識有多種渠道來源妆兑,而且日常存在獲取知識效率的問題魂拦。
拿產(chǎn)品經(jīng)理學習知識圖譜知識來講,可以在諸如簡書搁嗓、知乎芯勘、DataFun閱讀知識圖譜文章,也可以閱讀《知識圖譜》相關圖書腺逛,還可以向朋友請教知識圖譜的實踐荷愕。但由于知識圖譜技術棧比較長,知識點較多棍矛,往往抓不住重點安疗,導致入門就花費大量時間,效率是比較低的够委。
再拿日常辦公獲取內(nèi)部或外部相關信息為例荐类,有海量頁面,但需要花費大量時間一個個甄別茁帽,哪個是真正需要的掉冶。
可見在獲取知識方面,存在由于信息分散而導致獲取效率低下的問題脐雪。
假設做市場調(diào)研厌小,研究市場規(guī)模或發(fā)展情況战秋,可以一鍵查到答案璧亚,而非拿到一堆網(wǎng)頁再一個個瀏覽和互相印證,那么前者的解決方案,就可以大大提升知識獲取效率癣蟋。
解決以上問題的關鍵就是知識圖譜透硝,2012年知識圖譜被谷歌引入推薦引擎中,可以根據(jù)查詢關鍵詞一鍵生成答案疯搅,大大提升了用戶的體驗和搜索效率濒生,成功引領了技術風潮,被國內(nèi)搜索引擎廠商爭相效仿幔欧,也拉開了知識圖譜應用的序幕罪治。
知識圖譜是什么
維基百科給知識圖譜的定義是「谷歌公司用來支持從語義角度組織網(wǎng)絡數(shù)據(jù),從而提供智能搜索服務的知識庫」礁蔗。定義比較抽象觉义,需要層層剝離。
首先需要理解什么是知識浴井,知識是人類認知實踐的成果晒骇,分為經(jīng)驗知識和系統(tǒng)科學理論。一條條結構化的知識構成知識庫磺浙。
語義角度組織網(wǎng)絡數(shù)據(jù)洪囤,則是相對于傳統(tǒng)web鏈接方式組織數(shù)據(jù)方式。傳統(tǒng)搜索引擎通過網(wǎng)頁之間的鏈接組織網(wǎng)頁之間關系撕氧,并通過關鍵詞匹配展示哪些網(wǎng)頁瘤缩,本身并不需要對網(wǎng)頁內(nèi)容做理解,更多是從統(tǒng)計學角度提供搜索服務呵曹。而從語義角度組織網(wǎng)絡數(shù)據(jù),就需要從語義角度出發(fā)何暮,將網(wǎng)頁中內(nèi)容提取出語義形成一條條知識奄喂,并以語義網(wǎng)絡形式存儲知識。
到了應用層搜索的服務海洼,搜索引擎能夠從語義層理解用戶意圖跨新,并將最終結果直接展示給用戶,而非一堆網(wǎng)頁坏逢,大大改善了搜索體驗域帐。
知識的表示
知識圖譜中一條條知識通常表示為(實體,關系是整,實體)或(實體肖揣,關系,屬性)浮入。如(姚明龙优,妻子,葉莉)事秀,(姚明彤断,性別野舶,男)。即知識圖譜描述了實體與實體之間的關系和實體與屬性之間的關系宰衙。這種表示方式既對機器友好平道,也便于人的理解。不同知識之間形成關聯(lián)供炼,構成知識圖譜一屋。
上例中是一個最小化知識圖譜案例。謝霆鋒劲蜻、張柏芝陆淀、王菲為三個實體,每個實體與其他實體形成關系先嬉,每個實體自身也有一些屬性轧苫。實體與實體、實體與屬性之間關系疫蔓,共同構成知識圖譜含懊。
從這個角度來講,知識是認知和需要存儲的內(nèi)容衅胀,圖譜則是如何存儲知識的載體岔乔,數(shù)據(jù)庫則是具體存儲的實現(xiàn)。也即知識圖譜是在數(shù)據(jù)庫系統(tǒng)上滚躯,利用圖譜這種抽象載體雏门,表示知識這種認知內(nèi)容。
知識圖譜的構建
以上對知識圖譜解決問題掸掏、定義及表示做了描述茁影,在實際落地知識圖譜中,則需要考慮知識圖譜如何構建的問題丧凤。通常知識圖譜的構建分為:知識圖譜體系的構建募闲、知識獲取、知識融合愿待、知識存儲浩螺、知識推理。
知識圖譜體系的構建也叫知識建模仍侥,顧名思義就是就是搭建一個抽象的框架要出,用于后續(xù)數(shù)據(jù)實例的填充。具體來講农渊,就是要定義清楚有哪些類別知識圖譜厨幻,每個類別下有哪些實體、屬性,并且定義清楚實體與實體况脆,實體與屬性之間的相互關系饭宾。這個階段是需要業(yè)務人員和產(chǎn)品經(jīng)理核心做的工作,也即通過定義需求明確所需的知識模型格了。
知識獲取則是在知識建模的基礎上看铆,根據(jù)業(yè)務需要和知識模型框架,在結構化盛末、半結構化弹惦、非結構化數(shù)據(jù)中,獲取實體與實體悄但、實體與屬性的具體數(shù)據(jù)棠隐。在非結構化數(shù)據(jù)處理中,需要用到實體識別檐嚣、實體消歧助泽、關系提取等步驟。此階段也需要產(chǎn)品經(jīng)理深度參與嚎京,獲得知識圖譜可用的數(shù)據(jù)嗡贺。
知識融合則是對不同來源、不同語言鞍帝、不同結構的知識圖譜做融合诫睬,從而對已有知識圖譜做能力增強。
經(jīng)過以上步驟帕涌,知識圖譜初步構建完成摄凡,接下來則是對知識圖譜做存儲,通常有兩種存儲方式:按三元組方式一條條存儲在數(shù)據(jù)庫蚓曼、采用圖數(shù)據(jù)庫做存儲亲澡。
知識推理則是要解決已有知識圖譜實體或?qū)傩匀笔У膯栴},通過推理手段補齊缺失辟躏。當然在實際的上層應用中谷扣,也可以直接應用推理能力獲取結果土全。
知識圖譜的應用
經(jīng)過上面知識圖譜構建和存儲完成后捎琐,就可以將知識圖譜應用在具體業(yè)務上了。常見的應用有搜索裹匙、問答機器人(本質(zhì)也是搜索)瑞凑、推薦、推理等概页,其本質(zhì)都是利用已經(jīng)構建好的知識庫籽御,快速查詢生成精準的結果,從而帶給終端用戶更為高效便捷的體驗。
通過以上內(nèi)容技掏,產(chǎn)品經(jīng)理可以對知識圖譜有個大致入門了解铃将,如需進一步學習和深入,可入手《知識圖譜》(趙軍版)更為成體系的詳細學習知識圖譜各個知識點哑梳,加速知識圖譜落地應用進程劲阎。
關于作者:
小樂帝,一線AI產(chǎn)品經(jīng)理鸠真、簡書科技優(yōu)秀作者悯仙、產(chǎn)品經(jīng)理讀書會創(chuàng)始人。
「產(chǎn)品經(jīng)理讀書會」
專注于愛讀書愛思考的產(chǎn)品人提供讀書推薦吠卷、產(chǎn)品思考锡垄、以書會友的環(huán)境
歡迎愛讀書的產(chǎn)品人分享產(chǎn)品道路上的感悟
歡迎關注:產(chǎn)品經(jīng)理讀書會