醫(yī)學知識圖譜初識

醫(yī)學知識圖譜是實現(xiàn)智慧醫(yī)療的基石蚊锹,有望帶來更高效精準的醫(yī)療服務瞳筏。然而,現(xiàn)有知識圖 譜構建技術在醫(yī)學領域中普遍存在效率低牡昆,限制多姚炕,拓展性差等問題。針對醫(yī)療數(shù)據(jù)跨語種丢烘,專業(yè)性強柱宦,結構復雜等特點,本文對構建醫(yī)學知識圖譜的關鍵技術進行了自底向上的全面解析播瞳,涵蓋了醫(yī)學知識表示掸刊、抽取、融合和推理以及質量評估五部分內容赢乓。此外忧侧,還介紹了醫(yī)學知識圖譜在信息檢索、知識問答牌芋、智能診斷等醫(yī)療服務中的應用現(xiàn)狀蚓炬。最后,結合當前醫(yī)學知 識圖譜構建技術面臨的重大挑戰(zhàn)和關鍵問題躺屁,對其發(fā)展前景進行了展望试吁。

關鍵詞:知識圖譜;知識獲嚷タ取熄捍;知識融合;知識推理母怜;自然語言處理

引言?

自 1998 年萬維網之父 Tim Berners-Lee 提出語義網余耽,人們不斷在網絡等電子載體上表達和修正對客觀世界的理解,形成 了一個概念標準化的過程苹熏,同時隨著鏈接開放數(shù)據(jù) (Linked Open Data)的規(guī)模激增碟贾,互聯(lián)網上散落了越來越多的知識元數(shù)據(jù)。

知識圖譜就是在這樣的大數(shù)據(jù)背景下產生的一種知識表示和管理的方式轨域,強調語義檢索能力袱耽。近年來,在人工智能的蓬勃發(fā)展下干发,知識圖譜涉及到的知識抽取朱巨、表示、融合枉长、推理冀续、問答等關鍵問題得到一定程度的解決和突破,知識圖譜成為知識服務領域的一個新熱點必峰,受到國內外學者和工業(yè)界廣泛關注洪唐。

知識圖譜的前身是語義網,它吸收了語義網吼蚁、本體在知識組織和表達方面的理念凭需,使得知識更易于在計算機之間和計算機與人之間交換、流通和加工肝匆。具體來說粒蜈,一個知識圖譜由模式圖、數(shù)據(jù)圖及兩者之間的關系組成:模式圖對人類知識領域的概念層面進行描述术唬,強調概念及概念關系的形式化表達薪伏,模 式圖中節(jié)點是概念實體,邊是概念間的語義關系粗仓,如 part-of嫁怀;數(shù)據(jù)圖對物理世界層面進行描述,強調一系列客觀事實借浊。數(shù)據(jù)圖中的節(jié)點有兩類塘淑,一是模式圖中的概念實體,二是描述性字符串蚂斤,數(shù)據(jù)圖中的邊是具體事實的語義描述存捺;模式圖和數(shù)據(jù)圖之間的關系指數(shù)據(jù)圖的實例與模式圖的概念之間的對應,或者說模式圖是數(shù)據(jù)圖的模具。

著名的通用知識圖譜中有捌治,谷歌“Knowledge Graph”岗钩、搜狗“知立方”、YAGO肖油、DBpedia等兼吓,它們具有規(guī)模大、領域寬森枪,包含大量常識等特點视搏。目前,醫(yī)學是知識圖譜應用最 廣的垂直領域之一县袱,如上海曙光醫(yī)院構建的中醫(yī)藥知識圖譜浑娜、本體醫(yī)療知識庫 SNOMED-CT,IBM Watson Health等應用近兩年也開始進入人們視線式散。?

知識圖譜是智能大數(shù)據(jù)的前沿研究問題筋遭,它以獨有的技術優(yōu)勢順應了信息化時代的發(fā)展,比如漸增式的數(shù)據(jù)模式設計杂数;良好的數(shù)據(jù)集成宛畦;現(xiàn)有 RDF、OWL等標準支持揍移;語義搜索和知識推理能力等次和。在醫(yī)學領域,隨著區(qū)域衛(wèi)生信息化及醫(yī)療信息系統(tǒng)的發(fā)展那伐,積累了海量的醫(yī)學數(shù)據(jù)踏施。如何從這些數(shù)據(jù)中提煉信息,并加以管理罕邀、共享及應用畅形,是推進醫(yī)學智能化的關鍵問題,是醫(yī)學知識檢索诉探、臨床診斷日熬、醫(yī)療質量管理、電子病歷 及健康檔案智能化處理的基礎肾胯。

???本文首先介紹了醫(yī)學知識圖譜的構建技術竖席,主要涉及到醫(yī)學知識表示;醫(yī)學知識抽取敬肚,包括實體毕荐、關系、屬性的抽妊蘼憎亚;醫(yī)學知識融合;醫(yī)學知識推理和質量評估五個部分。然后介紹了基于醫(yī)學知識圖譜的包括檢索第美、問答蝶锋、決策等的應用現(xiàn)狀。最后對醫(yī)學知識圖譜的研究斋日、應用重點牲览,面臨的挑戰(zhàn)以及未來 的發(fā)展趨勢進行了展望。?

1 醫(yī)學知識圖譜構建?

????本文將醫(yī)學知識圖譜構建技術歸納為五部分恶守,即醫(yī)學知識的表示、抽取贡必、融合兔港、推理以及質量評估。通過從大量的結構化或非結構化的醫(yī)學數(shù)據(jù)中提取出實體仔拟、關系衫樊、屬性等知識圖譜的組成元素,選擇合理高效的方式存入知識庫利花。醫(yī)學知識融合對醫(yī)學知識庫內容進行消歧和鏈接科侈,增強知識庫內部的邏輯性和表達能力,并通過人工或自動的方式為醫(yī)學知識圖譜更新舊知識或補充新知識炒事。借助知識推理臀栈,推出缺失事實,自動完成疾病診斷與治療挠乳。質量評估則是保障數(shù)據(jù)的重要手段权薯,提高醫(yī)學知識圖譜的可信度和準確度。

1.1 醫(yī)學知識表示?

知識表示是為描述世界所做的一組約定睡扬,是知識符號化盟蚣、 形式化、模式化的過程卖怜,主要研究計算機存儲知識的方法屎开, 其表示方式影響系統(tǒng)的知識獲取、存儲及運用的效率马靠。然而醫(yī)學數(shù)據(jù)種類繁雜奄抽,存儲方式不一,電子病歷格式和標準不同虑粥,經常涉及交叉領域等特點如孝,導致醫(yī)學領域與其他領域在知識表示方面有所差異,同時也給醫(yī)學領域的知識表示帶來極大的挑戰(zhàn)娩贷。

????早期醫(yī)療知識庫運用的知識表示方法有:謂詞邏輯表示法第晰,產生式表示法,框架表示法,語義網表示法等等茁瘦。比如品抽, SNOMED-CT,早期的 MYCIN 系統(tǒng)甜熔,大腸桿菌數(shù)據(jù)庫 EcoCyc等圆恤。隨著知識圖譜中知識增長、關系復雜化腔稀,這些方法由于表示能力有限且缺乏靈活性廉涕,不再作為主要的知識表示方法贺氓,更多是作為醫(yī)學知識表示的輔助或補充。

本體表示法以網絡的形式表示知識,即以(實體 1廉白,關系避除, 實體 2)三元組來表示相關聯(lián)的兩個節(jié)點(實體)采蚀,在知識圖譜提出之后逐漸得到認可咪惠。它借鑒了語義網表示法但又有所區(qū)別:本體關注的是實體固有特征,比后者更聚焦疏尿,更深入瘟芝,因而也具有更大的發(fā)展?jié)摿Α6倔w的描述語言也多種多樣:主 要有RDF和RDF-S褥琐、DAML锌俱、OWL等。使用本體表示醫(yī)學術語可以提升數(shù)據(jù)整合能力:建立強大踩衩、可互操作的醫(yī)療信息系統(tǒng)嚼鹉;滿足重用共享傳輸醫(yī)療數(shù)據(jù)的需求;提供基于不同語義標準的統(tǒng)計聚合驱富。醫(yī)學領域本體的構建锚赤,需要深入分析醫(yī)學術語的結構和概念,才能將晦澀甚至是跨語言的醫(yī)學知識有效地表達出來褐鸥。目前的醫(yī)學知識本體庫有:醫(yī)學概念知識庫LinkBase线脚,TAMBIS本體庫(TaO)等等。

知識圖譜的節(jié)點個數(shù)影響著網絡的結構復雜度及推理的效率和難度叫榕。知識表示學習借助機器學習浑侥,將研究對象的語義信息表示為稠密低維向量,有效解決數(shù)據(jù)稀疏問題晰绎,從而提升知識融合和推理性能[寓落。低維向量表示是一種分布式表示 (distributed representation),它模仿人腦中使用多個神經元存儲對象的工作機制荞下,使用多維度向量表示對象的語義信息伶选。知識表示學習中的代表模型有:結構化表示法(Structure Embedding史飞,SE),單層神經網絡模型(single layer model仰税,SLM)构资,隱變量模型(latent factor model,LFM)陨簇,基于TransE的翻譯模型等等吐绵。這些模型考慮實體間的協(xié)同性和計算開銷,用向量表示實體河绽,再對表示實體的向量或關系進行相應的矩陣變換己单,提出評價函數(shù)來衡量實體間的相關性,并為 之后的知識補全和推理提供重要參考葵姥。Kleyko 等人證明了分布式表示方法表示醫(yī)學圖像進行分類精度能夠與最佳經典方法相同荷鼠;Henriksson 等人對比使用多種知識表示方法表示 EHR 中 4 類記錄:診斷記錄,藥物使用記錄榔幸,治療方法和病程記錄。顯然矮嫉,知識表示學習無疑為醫(yī)學知識圖譜的知識表示開辟了新 思路削咆。

1.2 醫(yī)學知識抽取?

????醫(yī)學知識圖譜的構建主要是從非結構化數(shù)據(jù)中人工或自動地提取實體、關系和屬性蠢笋。人工提取是通過專家依據(jù)一定規(guī)則收集并整理相關信息拨齐,提取知識。目前通過人工構建的醫(yī)學知識庫包括臨床醫(yī)學知識庫昨寞、SNOMED-CT瞻惋、ICD-10 等。自動提取則是利用機器學習援岩、人工智能歼狼、數(shù)據(jù)挖掘等信息抽取技術,從數(shù)據(jù)源中自動提取出知識圖譜的基本組成元素享怀。自動構建醫(yī) 學知識庫的典型例子有一體化醫(yī)學語言系統(tǒng) UMLS羽峰。人工提取的代價太大,知識的自動提取是目前重點的研究方向添瓷,也是將來構建知識圖譜的趨勢梅屉。本節(jié)主要介紹如何自動從數(shù)據(jù)源中抽取知識和信息,包括實體鳞贷、關系和屬性抽取坯汤。

1.2.1 實體抽取?

????識別文本中的生物醫(yī)學實體,其目的在于通過識別關鍵概念進一步提取關系和其他信息搀愧,并將識別的概念以標準化的形式表示出來惰聂。醫(yī)學領域的實體抽取是從醫(yī)學數(shù)據(jù)源中提取出特定類型的命名實體疆偿。本節(jié)將醫(yī)學實體的抽取方法歸納為三類:基于醫(yī)學詞典及規(guī)則的方法、基于醫(yī)學數(shù)據(jù)源的統(tǒng)計學和機器學習方法以及深度學習方法庶近。

1)基于醫(yī)學詞典及規(guī)則的方法?

該方法通過人工定義規(guī)則和模式匹配生成詞典或使用現(xiàn)有醫(yī)學詞典從語料中抽取醫(yī)學實體翁脆,該方法是具有挑戰(zhàn)性的。首先鼻种,目前沒有完整的字典囊括所有類型的生物命名實體反番,所以簡單的文本匹配算法是不足以應對實體識別的。其次叉钥,相同的單詞或短語其意義可根據(jù)上下文的改變而指代不同的物體(如罢缸,

鐵蛋白可以是生物物質或實驗室測試方法)。再次投队,許多生物或 藥物實體同時擁有多個名稱(如 PTEN 和 MMAC指代相同的基因)枫疆。因此,基于醫(yī)學詞典及規(guī)則只在最早期被廣泛使用敷鸦。 Friedman等通過自定義語義模式和語法來識別電子病歷中的醫(yī)學信息息楔。Wu等人使用了 CHV和 SNOMED-CT兩個醫(yī)學詞典得到了不錯的實驗結果。雖然該方法能達到很高的準確度扒披,但無法徹底解決上述問題值依,也過分依賴專家編寫的詞典和規(guī)則,無法適應醫(yī)學領域詞匯不斷涌現(xiàn)的現(xiàn)實情況碟案。

2)基于醫(yī)學數(shù)據(jù)源和數(shù)學模型的機器學習方法?

????該方法通過使用統(tǒng)計學和機器學習方法愿险,結合醫(yī)學數(shù)據(jù)源的特點訓練模型,進行實體識別价说。在英文醫(yī)學實體抽取方面辆亏, 最具代表性的標注語料是 I2B2 2010發(fā)布的英文電子病歷標注語料。另外鳖目,還有 SemEval扮叨、NTCIR等評測,以及 NCBI語料庫等疑苔,都提供了英文醫(yī)學實體標注數(shù)據(jù)甫匹。

????目前常用方法有隱馬爾可夫模型(HMM),條件隨機場模 型(CRF)惦费,支持向量機模型(SVM)等兵迅。Kazama 等人使用 SVM模型進行生物醫(yī)學命名實體識別,引入了 POS薪贫,詞緩存恍箭,無監(jiān)督訓練得到的 HMM狀態(tài)等特征。該方法在 GENIA 語料庫中準確率高于最大熵標記方法瞧省,并能較高效地應用于大規(guī)模語料集扯夭。Zhou等人通過一系列特征訓練 HMM 模型鳍贾,包括詞的構成特征,形態(tài)特征交洗,POS骑科,語義觸發(fā),文獻內名稱別名等构拳。其識別準確率達66.5%咆爽,在 GENIA語料庫中的召回率達66.6%。 綜合以上方法置森,Chen 和 Friedman利用MEDLEE系統(tǒng)來識別與生物醫(yī)學文本中與表型信息相對應的短語斗埂。該系統(tǒng)使用自然語言技術來識別期刊文章摘要中存在的表型短語。生物醫(yī)學的實體識別常迟旌#可使用較小的表型相關術語的知識庫呛凶。Chen 和 Friedman自動導入與語義類別相關的數(shù)千個 UMLS 術語,如細胞體功能和細胞功能障礙行贪,以及哺乳動物本體中的幾百個術語漾稀;并手動添加了幾百個術語。實驗結果表明建瘫,其實體識別準 確率達 64.0%县好,召回率達 77.1%。雖然結果不高暖混,但為之后的研究人員提供了一條可行的思路。?

在醫(yī)學領域翁授,命名實體識別的痛點在于數(shù)據(jù)質量的良莠不齊以及人工標注的專業(yè)性要求高拣播。目前有專門研究如何降低對于數(shù)據(jù)標注依賴的研究,其原理主要是利用海量未標注數(shù)據(jù)持續(xù)提升模型性能收擦,從小樣本中進行學習贮配,自我探索逐步學習新知識,形成一個交互學習過程塞赂。

3)深度學習方法?

????深度學習近年來開始被廣泛應用于命名實體識別泪勒,最具代表性的模型是2011年Collobert提出的一個深層神經網絡模型,其效果和性能超過了傳統(tǒng)算法宴猾。Sahu等人所提出的 CNN 與 RNN 級聯(lián)的方法生成詞嵌入特征圆存,其結果優(yōu)于目前最好的算法且不需要過多的特征工程。 在醫(yī)學領域仇哆,We 等人基于CRF和雙向RNN生成特征沦辙, 再使用SVM 進行疾病命名實體識別。目前醫(yī)學信息命名實體識別任務中最主流的深度學習模型是 BiLSTM-CRF 模型讹剔,Jagannatha等人對比了 CRF油讯,BiLSTM详民,BiLSTM-CRF 三種模型,以及一些它們的改進模型陌兑,在英文電子病歷命名實體識別的效果沈跨,實驗結果表明所有基于 LSTM 的模型都比 CRF效果更好,并且 BiLSTM 結合 CRF 模型能夠進一步提高評測結果 2%-5%的準確率兔综。

1.2.2 實體抽取?

????本文將醫(yī)學實體關系抽取歸結為兩類: a)同類型醫(yī)學實體層級關系抽取饿凛,如疾病的“腸胃病-慢性胃炎”等;b)不同類型關系抽取邻奠,如“疾病-癥狀”等笤喳。

1)同類型醫(yī)學實體層級關系抽取

同類型醫(yī)學實體層級關系相對較為單一,主要是 is-a 和 part-of關系碌宴。由于醫(yī)學有其嚴謹?shù)膶W科體系和行業(yè)規(guī)范杀狡,因此此類關系往往在醫(yī)學詞典、百科贰镣、信息標準中進行呜象。 ICD-10、SNOMED等醫(yī)療詞典或醫(yī)療數(shù)據(jù)庫重點關注醫(yī)學專業(yè)術語碑隆、受限詞匯的分類和概念標準化工作恭陡,權威且涵蓋范圍廣,在數(shù)量和質量上都有所保障上煤,被醫(yī)療行業(yè)廣泛認可休玩,是抽取層級間實體關系的首選來源。針對具體的醫(yī)療詞典劫狠、知識庫提供的數(shù)據(jù)格式和開放 API 接口拴疤,可通過爬蟲、正則表達式独泞、D2R映射等技術從中抽取分層結構呐矾,抽取三元組來匹配、 添加上下位關系懦砂。

2)不同類型醫(yī)學實體關系抽取?

????不同類型醫(yī)學實體間的語義關系識別大致基于兩大不同數(shù)據(jù)源而實現(xiàn)蜒犯。一是百科或其他結構化數(shù)據(jù)源,如 Medline荞膘,UMLS 等罚随;二是半結構化的電子病歷。?

????醫(yī)學實體類型相對有限(主要是疾病衫画、癥狀毫炉、治療、藥品等)削罩,目前通常在兩個實體間預定義好要抽取的關系類型瞄勾,再將抽取任務轉換為分類問題來處理费奸。如何預定義實體關系目前尚未有統(tǒng)一的標準,這取決于醫(yī)學知識圖譜構建過程中模式圖的設置进陡、實體識別情況愿阐、語料來源、構建目的及應用場景等趾疚,如 在 I2B2 2010 評測中缨历,將電子病歷中的實體關系分成了醫(yī)療問題與醫(yī)療問題、醫(yī)療問題與治療糙麦、醫(yī)療問題與檢查三類辛孵。

????近幾年,Uzuner 團隊在句子層面抽取了六類醫(yī)療實體關系赡磅,使用實體順序和距離魄缚、鏈接語法和詞匯特征來訓練 6 個 SVM 分類器,通過對比實驗焚廊,指出詞匯特征在實體關系識別中 的重要作用冶匹。在此基礎上,基于Medline 摘要咆瘟,F(xiàn)runza 等抽取了疾病嚼隘、治療間的三種關系,并引入 UMLS 生物和醫(yī)療實體特征袒餐,取得了不錯的實驗結果飞蛹。而 Abacha 等在同樣的任 務中使用人工模板和 SVM 的混合模型,取得了 94.07%的平均 F值灸眼。該研究指出桩皿,在樣本數(shù)較少時,模板匹配方法起主要作用幢炸,而面向海量樣本時則 SVM 起主要作用。

此外拒贱,在關系識別的分類方法對比研究中宛徊,Bruijn 等人在 I2B2 2010 評測中對比研究了有監(jiān)督分類和基于 Self-training 的半監(jiān)督分類的表現(xiàn),表明了UMLS逻澳、依存句法分析結果和未標記數(shù)據(jù)對關系識別有著顯著影響闸天。除了預定義關系然后轉換為分類任務來處理的方法,還有少量研究采用了模板匹配斜做、統(tǒng)計共現(xiàn)等方法來抽取關系苞氮。如在 Medline 摘要中通過統(tǒng)計基因名的共現(xiàn)來提取關系,并根據(jù)共現(xiàn)矩陣生成了關系圖瓤逼,或在 Medline 摘要中通過語法依賴樹進行圖的模式匹配笼吟,進而抽取因果關系库物。

1.2.3 屬性抽取

????屬性抽取是指對屬性和屬性值對(attribute-value pair, AVP)的抽取贷帮,其中屬性的抽取是指為醫(yī)學實體構造屬性列表戚揭,如藥品的屬性包括適應癥、禁忌癥等撵枢。屬性值的抽取是指為各實體附加具體的屬性值民晒,如阿莫西林是青霉素過敏者禁用。常見的抽取方法包括從開放鏈接數(shù)據(jù)提取锄禽、從結構化數(shù)據(jù)庫提取潜必、從百科類站點提取、從垂直網站進行包裝器歸納沃但、以及利用模式匹配從查詢日志中提取等磁滚。對于醫(yī)學知識圖譜來說,主要通過上文提及的醫(yī)學詞典和主流醫(yī)學站點來進行绽慈。值得一提的是恨旱,前者關于屬性和屬性值對的描述相對比較稀疏(特別對于中文領域),因此需從主流醫(yī)學站點進一步抽取整合坝疼。

????對于 AVP 結構化程度比較高的網站搜贤,如維基百科、A+醫(yī) 學百科6等钝凶,有規(guī)整的信息框(InfoBox)仪芒,可以方便地爬取識別InfoBox 部分,直接提取該實體對應的屬性名和屬性值耕陷,置信度高掂名,但規(guī)模較小。而對于更多形式各異哟沫、半結構化的醫(yī)藥站點和垂直文本來說饺蔑,通常是構建面向站點的包裝器,從待抽取 站點采樣并標注幾個典型的詳細頁面(Detailed Pages)嗜诀,利用這些頁面通過模式學習自動構建出一個或多個類 Xpath 表示的模式猾警,然后將其應用在該站點的其他詳細頁面中從而實現(xiàn)自動化 的 AVP 抽取。

1.3 醫(yī)學知識融合

????知識融合是高層次的知識組織隆敢,使不同來源的知識在同一框架規(guī)范下進行數(shù)據(jù)整合发皿、消歧、加工拂蝎、推理驗證穴墅、更新等 步驟7,目的是解決知識復用的問題,增強知識庫內部的邏輯性和表達能力玄货。針對知識圖譜中不同粒度的知識對象皇钞,知識融合 可細分為實體對齊、知識庫的融合等誉结。

1.3.1 實體對齊?

醫(yī)療知識圖譜中知識來源的多樣性導致了知識重復鹅士、知識質量良莠不齊、知識間關聯(lián)不夠明確等問題惩坑。 醫(yī)學實體在不同的數(shù)據(jù)源中存在嚴重的多元指代問題掉盅,例如阿奇霉素在百度百科中被稱為希舒美,在 A+醫(yī)學百科中別名有阿齊霉素以舒、阿奇紅霉素趾痘、疊氮紅霉素等,商品名有泰力特蔓钟、希舒美永票、舒美特等。 因此實體對齊是醫(yī)學知識融合中非常重要的一步滥沫。實體對齊是判斷多源異構數(shù)據(jù)中的實體是否指向真實世界同一對象的過程侣集。

現(xiàn)有的對齊算法有成對實體對齊與集體實體對齊兩類。成對實體對齊方法只考慮實例及其屬性相似度兰绣,包括基于傳統(tǒng)概率模型的實體對齊方法和基于機器學習的實體對齊方法世分。前者以Fellegi等人將基于屬性相似性評分的實體對齊問題轉換為分類問題的工作為基礎,至今仍應用于很多實體對齊工作中缀辩;后者常用的對齊方法有分類回歸樹算法臭埋、ID3 決策樹算法、SVM 分類方法臀玄、集成學習框架等基于有監(jiān)督學習的方法和無監(jiān)督學習下的層次圖模型等基于無監(jiān)督學習的方法瓢阴。

????集體實體對齊在成對實體對齊的基礎上在計算實體相似度時加入了實體間的相互關系,分為局部集體實體對齊與全局集體實體對齊健无。前者典型算法是使用向量空間模型和余弦相似度計算實體相似性荣恐,準確率不高,但召回率和運行速度比較可觀累贤。后者通過不同匹配決策之間的相互影響來調整實體間的相似度募胃,又分為基于相似性傳播和基于概率模型的集體實體對齊方法∑枧ǎ基于相似性傳播的方法通過初始匹配以“bootstrapping” 方式迭代地產生新的匹配[。Lacoste-Julien 等人在此基礎上提出的 SiGMa 算法更適合大規(guī)模知識庫检疫,但需要一定的人工干預讶请。基于概率模型的方法通過為實體匹配關系和決策建立復雜的概率模型,包括關系貝葉斯網絡模型夺溢、LDA 分配模型论巍、CRF 模型和 Markov邏輯網模型等,可以提高匹配效果风响,但效率還有待提高嘉汰。?

????當來自不同知識源的數(shù)據(jù)出現(xiàn)數(shù)據(jù)沖突時,需要考慮知識源的可靠性以及不同信息在各知識源中出現(xiàn)的頻度等因素状勤。阮彤等人]在構建中醫(yī)藥知識圖譜時對數(shù)據(jù)源的可信度進行評分鞋怀,結合數(shù)據(jù)在不同來源中出現(xiàn)的次數(shù),對數(shù)據(jù)項進行排序持搜, 并補充到相應的屬性值字段中密似。?

????隨著知識庫規(guī)模擴大和實體數(shù)量的增加,知識庫中的實體對齊越來越受到重視葫盼,如何準確高效地實體對齊是未來知識融 合的研究重點之一残腌。

1.3.2 知識庫融合?

????構建知識庫時需求和設計理念不同會導致知識庫中數(shù)據(jù)的多樣性和異構性。對于龐雜的醫(yī)療知識來說贫导,當前多數(shù)知識庫都是針對某個科室或者某類疾病或藥物來構建的抛猫,比如脾胃病 知識庫[60]、中醫(yī)藥知識圖譜等孩灯,若要得到更完善的醫(yī)療知識圖譜闺金,需要對不同的醫(yī)療知識庫進行融合以及將尚未涵蓋的知識和不斷產生的新知識融合到已有的知識圖譜中。醫(yī)療知識圖譜的構建是一個不斷迭代更新的過程钱反。?

????知識庫融合的研究工作始于“本體匹配”掖看,初期針對本體類別的語義相似性進行匹配。隨著知識庫規(guī)模擴大和結構復雜化面哥,類別哎壳、屬性以及實體和它們之間的相互關系等也成為考慮的因素。Suchanek 等人提出的基于概率的知識融合算法PAIRS以兩個知識庫作為輸入尚卫,能夠高效地跨本體同時對齊類別归榕、實例、屬性和關系吱涉。但 PARIS 需要一定的人工參與刹泄。由于人類的精力和認知有限,自動地從 Web 中獲取知識并進行融合十分必要怎爵。Dong 等人提出了將以消除歧義的三元組的形式從整個網絡中提取事實與使用 PRA 和神經網絡模型兩種方法從 Freebase 圖得到的先驗知識融合在一起的知識融合方法特石, 可達到自動構建 Web 規(guī)模的概率知識庫的水準,提升了效率鳖链。

????在醫(yī)療領域姆蘸,Dieng-Kuntz 等人將醫(yī)療數(shù)據(jù)庫轉換為醫(yī)療本體,然后對其他文本語料使用半自動的語言工具進行語義提取,在人工控制下對本體進行擴展和補全逞敷,并用啟發(fā)式規(guī)則自動建立知識的概念層次狂秦。Baorto 等人將數(shù)據(jù)源添加到臨床信息系統(tǒng)時先確定數(shù)據(jù)的控制術語是否已經存在,然后將新術語添加到 MED( Medical Entities Dictionary)推捐,同時建立審計流程以保證引入數(shù)據(jù)的一致性裂问。?

????目前醫(yī)療領域知識圖譜的融合技術雖有一些有意義的嘗試,但仍需要大量人工干預牛柒,高效的知識融合算法有待進一步研究堪簿。醫(yī)療領域的知識圖譜也可以考慮采用眾包的方式進行知識融合。

1.4 醫(yī)學知識推理?

推理是從已有知識中挖掘出隱含信息焰络,而知識推理更注重知識與方法的選擇與運用戴甩,盡量減少人工參與,推出缺失事實闪彼,完成問題求解甜孤。在醫(yī)學知識圖譜中,知識推理幫助醫(yī)生完成病患數(shù)據(jù)搜集畏腕、疾病診斷與治療缴川,控制醫(yī)療差錯率。然而描馅,即使對于相同的疾病把夸,醫(yī)生也會根據(jù)病人狀況作出不同的診斷,即

醫(yī)學知識圖譜必須處理大量重復矛盾的信息铭污,這就增加了構建醫(yī)學推理模型的復雜性恋日。 傳統(tǒng)的知識推理方法有基于描述邏輯(Description Logic, DL)推理嘹狞,基于規(guī)則推理(Rule-based Reasoning岂膳,CBR)與基于案例推理(Case-based Reasoning,CBR)等等磅网。Bousquet C 等人使用基于 DAML+OIL 描述邏輯執(zhí)行術語推理來改進藥 物警戒系統(tǒng)中信號檢測谈截;Chen R 等人采用 RBR 方法開發(fā)出糖尿病診斷系統(tǒng)以提供用藥建議;CARE-PARNER 系統(tǒng)則是基于CBR給出診斷結果與治療方案等等涧偷。

????傳統(tǒng)的知識推理方法雖在一定程度推動醫(yī)療診斷自動化進程簸喂,但是也存在學習能力不足,數(shù)據(jù)利用率不高燎潮,準確率待提升等明顯缺陷喻鳄,遠未達到實際應用的要求。面對日益增長的醫(yī)療數(shù)據(jù)确封,診斷時不可避免地會出現(xiàn)信息遺漏除呵,診斷時間延長等 問題唉锌。而人工智能,尤其是人工神經網絡(Artificial Neural Networks竿奏,ANNs)擁有從海量數(shù)據(jù)挖掘有用信息的天然優(yōu)勢。 ART-KNN(ART-Kohonen neural network)與 CBR 相結合可以提高后者在推理故障情況的效率和準確度腥放。神經張量網絡模型(neural tensor networks)在 FreeBase 等開放本體庫上對未知關系推理的準確率可達 90.0%泛啸。Karegowda A G 等人在 Pima 印第安人糖尿病知識庫(PIDD)中使用了遺傳算法 (Genetic Algorithm,GA)和反向傳播網絡(Back Propatation Network秃症,BPN)的混合模型候址,診斷準確率提高 7%左右。

????與深度學習將知識圖譜作為數(shù)據(jù)源不同种柑,基于圖的推理則將知識圖譜視為圖岗仑,以實體為節(jié)點,以關系或屬性為邊聚请,利用關系路徑來找到節(jié)點間的多步路徑荠雕,Path Ranking 算法,PTransE就是利用這樣的原理來推斷實體間的語義關系驶赏。圖數(shù)據(jù)庫使知識圖譜能以圖的數(shù)據(jù)結構進行存儲炸卑,與傳統(tǒng)數(shù)據(jù)庫相比,前者在高維度關聯(lián)查詢的效率明顯提高煤傍。然而圖數(shù)據(jù)庫尚未成熟盖文,暫無法完成太復雜的知識推理。較為流行的圖 數(shù)據(jù)庫有 Neo4j蚯姆,Titan五续,OrientDB和 ArangoDB等。王昊奮等人在醫(yī)療質量與患者安全輔助監(jiān)控系統(tǒng)中龄恋,就將醫(yī)療本體的數(shù)據(jù)存放在 AllegroGraph 圖數(shù)據(jù)庫中疙驾。

????與通用知識圖譜相類似,醫(yī)學知識圖譜也還有對跨知識庫知識推理篙挽、基于模糊本體的知識推理等問題的研究荆萤。

1.5 質量評估?

????數(shù)據(jù)的質量直接影響數(shù)據(jù)的運用,質量評估是保障數(shù)據(jù)的重要手段铣卡,可以量化數(shù)據(jù)質量链韭,篩選出置信度高的數(shù)據(jù)。醫(yī)學診斷對數(shù)據(jù)和醫(yī)學知識圖譜的可信度和準確度提出了更高的要求煮落。質量評估并不是構建醫(yī)療知識圖譜的最后一步敞峭,而是貫穿 在知識圖譜的整個生命周期:早在 2013 年本體峰會(Ontology Summit2013)就對本體的生命周期的各個階段所要進行的評估工作做了相關的說明。

????目前蝉仇,知識圖譜/本體的評估方法可分為四大類:基于黃金 標準的方法旋讹,基于本體任務/應用的方法殖蚕,數(shù)據(jù)驅動的方法,和基于指標的方法沉迹。表 1 對比了這幾種本體評估方法睦疫。

????具體到醫(yī)學領域,本體評估方法因應用場景而異:Clarke 等人使用基于任務評估方法來分析基因本體的從 2004 至 2012 年的性能鞭呕;Bright 等使用本體設計原則和領域專家審查意見 作為指標來評估本體在抗生素決策支持系統(tǒng)中的效果蛤育;Gordon 等通過將電子病歷,診斷案例和臨床實踐等來構造“黃 金標準”來評估葫松,改進傳染疾病本體 BCIDO等瓦糕。為方便用戶進行本體評估和加快本體評估自動化進程,本體評估工具封裝了評估方法。不同的工具從不同的視角對本體的不同指標進行評估。針對評估的側重點拘鞋,選擇合適的工具才能對本體作出 符合應用要求的評估。

????比較常用的本體評估工具有:ODEval圣勒,OOPS,OntoManager未玻,Core等灾而。除了醫(yī)學本體,醫(yī)學知識圖譜還涵蓋其他復雜多樣的信息扳剿,因此旁趟,質量評估還包括對數(shù)據(jù)質量, 專家信息庇绽,知識庫等方面進行評估锡搜。?

相比通用領域的知識圖譜,醫(yī)學領域的知識圖譜評估存在以下特殊性:a)鑒于醫(yī)學的嚴謹性瞧掺,評估往往綜合多種方法進行多角度的評估耕餐,如 Bright 等利用本體設計原則和領域專家審查來進行等級評估; b)往往需設置等級較高的警告(alerts)辟狈,如與處方相關的警報包括抗生素-微生物不匹配警報肠缔、用藥過敏 警報、非推薦的經驗性抗生素治療警報哼转、治療方案-癥狀間不匹配警報等明未;c)除了從形式方面評價知識圖譜以外,也注重于檢驗知識差距壹蔓,因為知識的全面性和準確性將直接影響臨床決策支持的置信度趟妥。此外,醫(yī)學知識圖譜是融合計算機科學等眾多學科的交叉學科佣蓉,評價指標不能簡單地照搬某個的學科的指標披摄,而是應該綜合考慮眾多因素亲雪。知識圖譜/本體評估方法如下表所示:


因此,除了借鑒通用知識圖譜質量評估方法疚膊,Ammenwerth E 等人結合醫(yī)學本身的特點义辕,就評價醫(yī)學知識圖譜時面臨的評價對象的復雜度,評價指標與利益相關者的關系寓盗,評價動機三 大問題出發(fā)终息,分別提出解決方案。

不難看出贞让,醫(yī)學知識圖譜質量評估的研究主要集中在方法,工具以及數(shù)據(jù)的研究這三方面柳譬。然而喳张,現(xiàn)有的質量評估缺乏系統(tǒng)化,鮮有從醫(yī)學領域特性的角度對知識圖譜進行綜合評估美澳,多是借鑒通用的質量評估方法從微觀上去評估某一項指標销部,具有分散性,片面性制跟。

2 醫(yī)學知識圖譜應用

隨著人們對健康問題的愈發(fā)重視舅桩,醫(yī)療保健費用、需求的增長與優(yōu)質醫(yī)療資源不足之間的矛盾亟待解決雨膨。對此擂涛,由于近幾年人工智能的飛速發(fā)展以及精準醫(yī)療、智慧醫(yī)療的提出聊记,醫(yī)學知識圖譜應用正受到國內外企業(yè)撒妈、學界的廣泛關注,有望帶來更廉價排监、高效狰右、精準的醫(yī)療建議和診斷。本文可以從已有的醫(yī)學知識圖譜的應用中一窺其巨大潛力舆床。

2.1 醫(yī)療信息搜索引擎?

????傳統(tǒng)的醫(yī)療搜索引擎需要對百億計的醫(yī)療相關網頁進行檢索棋蚌、存儲、處理挨队,但難以理解用戶的語義查詢谷暮。而基于醫(yī)學知識圖譜的搜索,不僅提供用戶網頁間超鏈接的文檔關系瞒瘸,還包 括不同類型實體間豐富的語義關系坷备。?

????知識圖譜對于傳統(tǒng)信息搜索的優(yōu)化主要體現(xiàn)在查詢擴展,從知識圖譜中抽取與查詢相關的若干實體及實體關系和屬性進行擴展查詢情臭,以更好的理解用戶的查詢需求省撑。Aronso 等人較早將信息檢索技術結合 UMLS 進行查詢擴展赌蔑,并應用于醫(yī)學文獻檢索。 Díazgaliano 等人在生物醫(yī)學信息搜索中加入了醫(yī)學本體 MeSH來進行查詢擴展竟秫,包含同義娃惯、近似同義和密切 相關概念的實體和關系,改進了信息檢索的效果肥败。Huang 等人在醫(yī)學本體的基礎上趾浅,使用 LSA 自動挖掘實體間的語義關系,如藥物誘導疾病關系馒稍、藥物間相互作用關系等皿哨,對實體關系、實體-實體的查詢進行了擴展纽谒。中國中醫(yī)科學院的賈李蓉 等于 2002 年開始研制中醫(yī)藥學語言系統(tǒng)证膨,構建了包含12萬多個概念、60余萬術語以及127余萬語義關系的中醫(yī)藥知識圖譜鼓黔。它通過在檢索系統(tǒng)中嵌入“知識卡片”以及一個“知識地圖”展示系統(tǒng)央勒,將中醫(yī)領域概念可視化,用戶可以選擇其中 的概念開始構造查詢或搜索澳化。

????目前崔步,國外典型的醫(yī)療專用搜索引擎有 WebMd8、 OmniMedicalSearch 9 缎谷、 Healthline10等 井濒。 其 中 WebMd 和 OmniMedicalSearch 分別屬于全文索引和目錄索引類型的傳統(tǒng) 搜索引擎,Healthline 是一個基于知識庫的醫(yī)學信息搜索引擎列林, 其知識庫涵蓋超 850眼虱,000 項醫(yī)療元數(shù)據(jù)和 50,000 條相互關聯(lián) 的概念。Google 率先提出將知識圖譜應用于搜索席纽,在醫(yī)療搜索 應用上捏悬,當用戶搜索疾病或癥狀時,Google 提供超過 400 種健康狀況的數(shù)據(jù)润梯,通過一張信息卡片过牙,給出典型癥狀以及如是否嚴重、是否具有傳染性纺铭、影響哪些年齡段的人等細節(jié)信息寇钉。而國內主流醫(yī)療搜索引擎有搜狗名醫(yī)、360良醫(yī)舶赔,這兩者都是結合了元搜索索引方式和知識庫的搜索引擎扫倡,聚合權威的知識、醫(yī)療竟纳、學術網站撵溃,為用戶提供包括維基百科疚鲤、知乎問答、國際 前沿學術論文等權威缘挑、真實內容集歇。

基于知識圖譜的搜索引擎已成為現(xiàn)今搜索引擎的主要形式,其技術框架也在不斷改進和完善语淘。目前的醫(yī)療搜索引擎主要受限于醫(yī)學知識圖譜的知識數(shù)量和質量诲宇,構建完備的醫(yī)學知 識圖譜是其關鍵。

2.2 醫(yī)療問答系統(tǒng)?

????問答系統(tǒng)也是知識圖譜的典型應用場景惶翻。目前在基于知識圖譜的問答系統(tǒng)中采用的方法主要包括:基于信息提取的方法姑蓝,利用問句信息結合知識庫資源獲取候選答案;基于語義解析的方法吕粗,將自然語言問句解析成一種邏輯表達形式它掂,通過這種結構化表達從知識庫中尋找答案;基于向量空間建模的方法溯泣,使用向量空間描述自然語言問句以及知識圖譜中的實體和關系,通過機器學習榕茧、深度學習等方法生成問答模型進行回答垃沦。?

早期的醫(yī)療問答系統(tǒng)的研究主要集中于信息檢索、提取和摘要技術用押。知識圖譜概念的提出肢簿,致使問答系統(tǒng)研究熱點轉移到基于知識圖譜的問答系統(tǒng)研究。Terol等人使用了 UMLS 以及 WordNet 兩種知識庫蜻拨,設置了 10 類醫(yī)學問題類型池充,利用自然語言處理技術的應用來生成和處理問題的邏輯形式, 從知識庫中提取答案缎讼。Abacha 等人對比了基于醫(yī)學本體的 醫(yī)療問答系統(tǒng)收夸,結合醫(yī)學本體、領域知識血崭,NLP 相關技術和語義關系卧惜,實現(xiàn)了一個醫(yī)療自動問答系統(tǒng)。華東理工大學阮彤夹纫、 王昊奮等人與上海曙光醫(yī)院合作構建了包括疾病庫咽瓷、證庫、

癥狀庫舰讹、中草藥庫和方劑庫的中醫(yī)藥知識圖譜茅姜,并基于該知識圖譜進行中醫(yī)藥問答和輔助開藥。該系統(tǒng)通過基于知識圖譜的分詞月匣、模板匹配钻洒、模板的翻譯執(zhí)行來回答概念奋姿、實體、屬性航唆、屬性值的模板組合問題胀蛮,并將圖譜中存儲的數(shù)據(jù)自動轉換成推理引擎適用的推理規(guī)則,再結合醫(yī)生工作站傳來的病人事實數(shù)據(jù)糯钙,輔助醫(yī)生開方粪狼。

????在醫(yī)療垂直領域的問答系統(tǒng)研究中,受限于現(xiàn)有醫(yī)學知識圖譜的推理能力任岸,以及醫(yī)學知識表示的復雜性再榄,尚未出現(xiàn)重大的突破。而反觀開放領域享潜,對特定領域專業(yè)知識要求不高的情 況下困鸥,IBM 的 Watson 系統(tǒng)、微軟的小冰都是融合傳統(tǒng)問答系統(tǒng)和知識圖譜的成功案例剑按。

2.3 醫(yī)療決策支持系統(tǒng)?

????借助醫(yī)療知識圖譜疾就,醫(yī)療決策支持系統(tǒng)可以根據(jù)患者癥狀描述及化驗數(shù)據(jù),給出智能診斷艺蝴、治療方案推薦及轉診指南猬腰,還可以針對醫(yī)生的診療方案進行分析、查漏補缺猜敢,減少甚至避免誤診姑荷。

ángel 等人設計了一個本體驅動的,基于邏輯推理和概 率統(tǒng)計優(yōu)化的醫(yī)學鑒別診斷系統(tǒng) ODDIN缩擂,系統(tǒng)的知識庫框架包含一個邏輯規(guī)則知識庫和一個醫(yī)學本體知識庫鼠冕,在邏輯規(guī)則知識庫中,定義了四種邏輯規(guī)則胯盯,而醫(yī)學本體知識庫則是綜合了 多個醫(yī)學本體資源懈费,支持多種本體表示形式,包括 RDF博脑、RDFS楞捂、 OWL 和 SPARQL,診斷方法的核心是基于貝葉斯理論進行改 進趋厉。Martnez-Romero 等人[106]設計的 iOSC3 系統(tǒng)是一個基于本體針對急性心臟病進行智能監(jiān)控和診斷的系統(tǒng)寨闹,該系統(tǒng)分析患 者的狀況并提供最佳治療方案的建議,其知識庫由 OWL 本體 和表示專家知識的一組 SWRL 規(guī)則所構成君账。王昊奮繁堡、張金康等人通過搜集中文開放鏈接數(shù)據(jù)中的醫(yī)療信息(ICD9、ICD10 等)和主流醫(yī)學站點中的醫(yī)療知識(39 健康網、尋醫(yī)問藥等)構建了醫(yī)療知識圖譜椭蹄,并將其應用于上海林康醫(yī)療信息技術有限公司的醫(yī)療質量與患者安全輔助監(jiān)控系統(tǒng)和處方審核智能系統(tǒng)中闻牡,前者基于知識圖譜來進行抗生素不合理使用的監(jiān)控、危

急值預測绳矩,后者快速判斷處方為合理罩润、疑似不合理和不規(guī)范處 方,從而促進用藥的合理性翼馆。

????將知識圖譜應用于醫(yī)療決策是目前的研究熱點割以。但是,在實際應用中应媚,主要存在著兩方面的問題:一是缺少完備的全科醫(yī)學知識圖譜严沥,二是醫(yī)療決策的可靠性。對于前者中姜,目前基于知識圖譜實際應用的醫(yī)療決策系統(tǒng)消玄,主要還是針對于特定疾病類型的決策,無法廣泛應用丢胚,如 IBM 的 Watson Health 主要面向腫瘤和癌癥的決策支持翩瓜,基于巨大的知識庫和強大的認知計算能力,為臨床醫(yī)師提供快速的携龟、個性化的循證腫瘤治療方案兔跌。對于后者,醫(yī)療決策是直接關系到使用者的身體健康問題骨宠,依靠人工智能進行醫(yī)療決策對結果的準確性和可靠性有更高的要求。現(xiàn)階段相满,基于知識圖譜的醫(yī)療決策只是扮演著支持和輔助的角色层亿。?

3 挑戰(zhàn)及研究展望?

知識圖譜是語義網與知識庫的融合與升華。知識圖譜的優(yōu)勢是具備強大的語義處理與開放互聯(lián)能力立美。對醫(yī)學領域而言匿又,由于其專業(yè)性、規(guī)范性建蹄、術語有限性等特點碌更,可以從醫(yī)學詞典、醫(yī)學標準洞慎、電子病歷等來源獲取到高質量數(shù)據(jù)痛单;另外在科教行業(yè)中,存在著知識管理劲腿、語義檢索旭绒、商業(yè)分析、決策支持等需

求,醫(yī)學知識圖譜的研究能推進海量數(shù)據(jù)的智能處理挥吵,催生上層智能醫(yī)學的應用重父。醫(yī)學知識圖譜是大數(shù)據(jù)與醫(yī)學的結合,將 成為知識圖譜和大數(shù)據(jù)智能的前沿問題忽匈。

1)人工智能?

????人工智能房午,尤其是深度學習已經在計算機視覺、語音識別丹允、機器翻譯等領域超越了傳統(tǒng)算法郭厌,而其在醫(yī)學領域中的知識融合與推理等方面的研究潛力還有待挖掘。擁有強大學習能力的深度學習與有著豐富數(shù)據(jù)儲備的知識庫相結合嫌松,將逐步擴展認 知能力沪曙,為大規(guī)模知識圖譜找到更寬廣的應用場景。

2)復雜多樣的數(shù)據(jù)源(跨語言萎羔,開放域)?

????互聯(lián)網和電子病例帶來了醫(yī)療數(shù)據(jù)的爆炸性增長液走,然而這些數(shù)據(jù)在語種、主題贾陷、存儲等方面都存在較大差異≡悼簦現(xiàn)有的研究成果多集中在特定數(shù)據(jù)集上,普遍存在算法準確率低髓废、限制條件多巷懈、擴展性差等問題,同時知識復用慌洪、實體消歧等問題也有待進一步研究顶燕。跨語言醫(yī)學知識圖譜成為當前的研究熱點冈爹, 我國的研究者更應發(fā)揮自身在中文信息處理方面的優(yōu)勢涌攻。

3)眾包技術

????眾包反饋機制不僅可以有效提高數(shù)據(jù)質量,還能作為質量評估的重要補充频伤。眾包平臺與知識庫的有機結合恳谎,能夠修 正機器無法識別的錯誤,提高知識圖譜的質量與性能憋肖。39 健康網因痛,尋醫(yī)問藥網的問答區(qū)都有專業(yè)人士在線解答問題;A+醫(yī)百科中的藥物信息由醫(yī)學研究者共同編輯完成岸更。而另一方面鸵膏,如何評估和保障提交結果的質量,也開始受到國內外學者的關 注怎炊。

4)可視化?

????知識圖譜可視化的真正意義在于讓人直觀地了解推理的過程與結果较性。而醫(yī)學知識圖譜可視化站在醫(yī)生或病人的立場用僧,尋求最佳的知識展示方案:病人能夠理解診斷結果,醫(yī)生能夠利 用知識圖譜的動態(tài)推理過程作出合理診斷赞咙。?

4 結束語?

隨著醫(yī)療信息化的發(fā)展责循,醫(yī)學電子數(shù)據(jù)有了一定的積累。構建醫(yī)療領域的知識圖譜攀操,可以從海量數(shù)據(jù)中提煉出醫(yī)療知識院仿,并合理高效地對其進行管理、共享及應用速和,對當今的醫(yī)療行業(yè)有著重要意義歹垫,也是很多企業(yè)和研究機構的研究熱點。本文從醫(yī)療知識圖譜的構建與應用角度颠放,綜述了醫(yī)療知識圖譜的相關

背景排惨、現(xiàn)有技術和應用,總結了目前醫(yī)療知識圖譜面臨的主要 挑戰(zhàn)碰凶,并對其未來的研究方向進行了展望暮芭。

????醫(yī)學知識圖譜將知識圖譜與醫(yī)學知識進行結合,定會推進醫(yī)學數(shù)據(jù)的自動化與智能化處理欲低,為醫(yī)療行業(yè)帶來新的發(fā)展契機辕宏。雖然目前對于醫(yī)療知識圖譜的研究工作有了很多很有意義的嘗試,但總的來說還不夠完善和深入砾莱,需要更進一步的研究瑞筐。希望本文能夠為醫(yī)療知識圖譜在國內的研究提供一些幫助與啟發(fā)。?

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末腊瑟,一起剝皮案震驚了整個濱河市聚假,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌闰非,老刑警劉巖膘格,帶你破解...
    沈念sama閱讀 211,639評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異河胎,居然都是意外死亡闯袒,警方通過查閱死者的電腦和手機虎敦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,277評論 3 385
  • 文/潘曉璐 我一進店門游岳,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人其徙,你說我怎么就攤上這事胚迫。” “怎么了唾那?”我有些...
    開封第一講書人閱讀 157,221評論 0 348
  • 文/不壞的土叔 我叫張陵访锻,是天一觀的道長褪尝。 經常有香客問我,道長期犬,這世上最難降的妖魔是什么河哑? 我笑而不...
    開封第一講書人閱讀 56,474評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮龟虎,結果婚禮上璃谨,老公的妹妹穿的比我還像新娘。我一直安慰自己鲤妥,他們只是感情好佳吞,可當我...
    茶點故事閱讀 65,570評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著棉安,像睡著了一般底扳。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上贡耽,一...
    開封第一講書人閱讀 49,816評論 1 290
  • 那天衷模,我揣著相機與錄音,去河邊找鬼菇爪。 笑死算芯,一個胖子當著我的面吹牛,可吹牛的內容都是我干的凳宙。 我是一名探鬼主播熙揍,決...
    沈念sama閱讀 38,957評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼氏涩!你這毒婦竟也來了届囚?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,718評論 0 266
  • 序言:老撾萬榮一對情侶失蹤是尖,失蹤者是張志新(化名)和其女友劉穎意系,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體饺汹,經...
    沈念sama閱讀 44,176評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡蛔添,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,511評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了兜辞。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片迎瞧。...
    茶點故事閱讀 38,646評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖逸吵,靈堂內的尸體忽然破棺而出凶硅,到底是詐尸還是另有隱情,我是刑警寧澤扫皱,帶...
    沈念sama閱讀 34,322評論 4 330
  • 正文 年R本政府宣布足绅,位于F島的核電站捷绑,受9級特大地震影響,放射性物質發(fā)生泄漏氢妈。R本人自食惡果不足惜粹污,卻給世界環(huán)境...
    茶點故事閱讀 39,934評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望首量。 院中可真熱鬧厕怜,春花似錦、人聲如沸蕾总。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,755評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽生百。三九已至递雀,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蚀浆,已是汗流浹背缀程。 一陣腳步聲響...
    開封第一講書人閱讀 31,987評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留市俊,地道東北人杨凑。 一個月前我還...
    沈念sama閱讀 46,358評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像摆昧,于是被迫代替她去往敵國和親撩满。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,514評論 2 348

推薦閱讀更多精彩內容

  • 姓名:劉成龍 學號:16020199016 轉載自:https://www.jiqizhixin.com/arti...
    羽_71ba閱讀 4,172評論 1 17
  • 知識圖譜技術 知識圖譜(Knowledge Graph绅你,KG)描述客觀世界的概念伺帘、實體、事件及其之間的關系忌锯。其中伪嫁,...
    sennchi閱讀 5,264評論 0 17
  • 這篇文章主要參考了[1]劉嶠,李楊,段宏,劉瑤,秦志光. 知識圖譜構建技術綜述[J]. 計算機研究與發(fā)展,2016...
    我偏笑_NSNirvana閱讀 52,478評論 6 125
  • 代碼如下: 郵箱 :ithelei@sina.cn Good Luck!
    養(yǎng)碼哥閱讀 5,094評論 0 0
  • 一條魚問烏龜:“為什么你遇事就躲张咳,縮在殼中?”烏龜慢悠悠地伸展四肢說:“別人的評論重要嗎似舵?那不是逃避脚猾,只是求一個安...
    藝菲_夏閱讀 422評論 0 2