如果將知識(shí)圖譜比作小孩玩的磁力棒魁亦,把一個(gè)個(gè)互不相干的知識(shí)渔隶,根據(jù)關(guān)聯(lián)性連成一個(gè)“語(yǔ)義網(wǎng)絡(luò)”,這對(duì)機(jī)器來(lái)說(shuō)就是圖譜洁奈。相對(duì)于目前機(jī)器學(xué)習(xí)中的“深度學(xué)習(xí)”來(lái)講间唉,知識(shí)圖譜是一種確定的、可解釋的利术、有跡可循的機(jī)器學(xué)習(xí)方式呈野。知識(shí)圖譜能夠使機(jī)器更加智能化,從而更好的與人溝通印叁。
在機(jī)器自動(dòng)梳理出數(shù)據(jù)之間的關(guān)聯(lián)被冒、自動(dòng)生成新的知識(shí)這個(gè)過(guò)程中,機(jī)器建立起了認(rèn)識(shí)轮蜕,能讀懂和理解人類(lèi)昨悼,也就是具有了跟人類(lèi)一樣,獲取和形成知識(shí)的能力跃洛。簡(jiǎn)單說(shuō)率触,知識(shí)圖譜對(duì)于人工智能的價(jià)值就在于,讓機(jī)器具備了認(rèn)知能力汇竭。
智能搜索的率先一擊
以商業(yè)搜索引擎公司為首的互聯(lián)網(wǎng)巨頭們最先意識(shí)到了知識(shí)圖譜的戰(zhàn)略意義葱蝗。Google于2012年5月首次提出了用知識(shí)圖譜描述關(guān)聯(lián)關(guān)系,從而改善搜索結(jié)果的想法细燎。緊隨其后两曼,國(guó)內(nèi)搜狗提出了“知立方”、微軟推出的Probase和百度的“知心”找颓。 各大巨頭紛紛投入重兵布局知識(shí)圖譜合愈,從而對(duì)搜索引擎形態(tài)產(chǎn)生了非常顯著的影響。
舉個(gè)栗子,我們百度搜索“郭敬明”佛析。傳統(tǒng)的搜索引擎僅僅是搜索出含有“郭敬明”關(guān)鍵詞的所有網(wǎng)頁(yè)益老,并根據(jù)點(diǎn)擊率、更新時(shí)間寸莫、網(wǎng)站權(quán)重等因素排列捺萌。而目前的搜索引擎則智能得多,結(jié)合知識(shí)圖譜的應(yīng)用相當(dāng)于編織了一張巨大的網(wǎng)膘茎,把人物桃纯、關(guān)系聯(lián)系起來(lái)。如下圖所示:
搜索結(jié)果會(huì)自動(dòng)匹配網(wǎng)絡(luò)點(diǎn)擊率最高的:郭敬明身高披坏、郭敬明陳學(xué)冬戀情态坦、郭敬明抄襲罵戰(zhàn)、郭敬明小說(shuō)棒拂、影視作品等等伞梯。并根據(jù)郭敬明這個(gè)實(shí)體的屬性,羅列出其他你有可能感興趣的同類(lèi)型明星演員和青年作家帚屉。
再舉個(gè)經(jīng)典例子谜诫,我們中國(guó)人買(mǎi)房子,買(mǎi)完房子下一步就是裝修攻旦,裝修完了就會(huì)買(mǎi)家具喻旷,然后晾曬入住。這種常識(shí)關(guān)系牢屋,也是知識(shí)圖譜中非常重要的一部分且预。如果你在網(wǎng)上搜索房屋交易信息,那么裝修公司就可以跟上去做廣告烙无;甚至家具供應(yīng)商辣之、空氣凈化設(shè)施供應(yīng)商都可以跟進(jìn)。這就是一種預(yù)測(cè)皱炉。
知識(shí)圖譜的應(yīng)用場(chǎng)景
除了智能搜索,知識(shí)圖譜目前應(yīng)用到的場(chǎng)景還包括:
l 反欺詐:這主要有兩部分原因狮鸭,一個(gè)是反欺詐的數(shù)據(jù)來(lái)源多樣合搅,結(jié)構(gòu)化和非結(jié)構(gòu)化,二是不少欺詐案件會(huì)涉及到復(fù)雜的關(guān)系網(wǎng)絡(luò)
l 不一致性驗(yàn)證(類(lèi)似交叉驗(yàn)證)——關(guān)系推理
l 異常分析(運(yùn)算量大歧蕉,一般離線)
l 靜態(tài)分析:給定一個(gè)圖形結(jié)構(gòu)和某個(gè)時(shí)間點(diǎn)灾部,從中去發(fā)現(xiàn)一些異常點(diǎn)(比如有異常的子圖)。
l 動(dòng)態(tài)分析:分析其結(jié)構(gòu)隨時(shí)間變化的趨勢(shì)惯退。(假設(shè)短時(shí)間內(nèi)知識(shí)圖譜結(jié)構(gòu)的變化不會(huì)太大赌髓,如果它的變化很大,就說(shuō)明可能存在異常,需要進(jìn)一步的關(guān)注锁蠕。會(huì)涉及到時(shí)序分析技術(shù)和圖相似性計(jì)算技術(shù)夷野。)
l 失聯(lián)客戶(hù)管理 挖掘出更多的新聯(lián)系人,提高催收的成功率荣倾。
等等……
事實(shí)上悯搔,知識(shí)圖譜的應(yīng)用遠(yuǎn)不止于此。在我們看來(lái)舌仍,這個(gè)世界就是一張巨大的知識(shí)圖譜妒貌,是無(wú)數(shù)個(gè)實(shí)體關(guān)系對(duì)。幾乎可以覆蓋所有行業(yè)和領(lǐng)域铸豁。包括當(dāng)下非常熱門(mén)的教育灌曙、醫(yī)療、金融节芥、商業(yè)咨詢(xún)在刺、法律咨詢(xún)、情感陪護(hù)等等藏古。當(dāng)然前提是增炭,要像人類(lèi)社會(huì)的細(xì)分一樣,在每個(gè)行業(yè)都建立起特有的知識(shí)圖譜拧晕,并不斷完善和更新隙姿。
建立知識(shí)圖譜面臨的挑戰(zhàn)
常識(shí)摄杂,即“commen sense”丧慈,就是大家都知道的知識(shí)。比如說(shuō)人會(huì)走玩祟、魚(yú)會(huì)游靡馁、長(zhǎng)和短欲鹏、高和低等等。知識(shí)圖譜的建立經(jīng)常會(huì)用到一些常識(shí)臭墨,當(dāng)問(wèn)題涉及到常識(shí)的時(shí)候赔嚎,這個(gè)問(wèn)題的解釋就會(huì)變得非常困難。
因?yàn)槟壳皩?duì)機(jī)器而言胧弛,常識(shí)仍然十分缺乏尤误。而常識(shí)缺乏的根本原因在于我們很少會(huì)提及常識(shí)。正因?yàn)榇蠹叶贾莱WR(shí)结缚,故而沒(méi)必要提及损晤,以至于語(yǔ)料中也不會(huì)顯式提及常識(shí)。這樣一來(lái)红竭,我們之前提到過(guò)的尤勋,所有基于文本抽取的方法就會(huì)失效喘落。
常識(shí)的普遍性缺乏,是目前人工智能領(lǐng)域發(fā)展面臨的最大的障礙最冰。
—THE END—
下期內(nèi)容:區(qū)塊鏈技術(shù)如何打破知識(shí)圖譜構(gòu)建的瓶頸問(wèn)題瘦棋? | “人工智能+區(qū)塊鏈”科普第9問(wèn)