摘要
臺(tái)灣國家健康保險(xiǎn)研究數(shù)據(jù)庫(NHIRD)舉例說明了人口級(jí)別的數(shù)據(jù)源蜂挪,用于生成現(xiàn)實(shí)世界的證據(jù)來支持臨床決策和醫(yī)療保健決策。像所有索賠數(shù)據(jù)庫一樣嗓化,使用NHIRD進(jìn)行的研究也存在一些有效性問題棠涮,例如診斷代碼的準(zhǔn)確性以及未測混雜因素的問題。努力驗(yàn)證診斷代碼或開發(fā)解決未測混雜因素的方法已大大提高了NHIRD研究的可靠性刺覆。最近严肪,臺(tái)灣衛(wèi)生福利部(MOHW)建立了一個(gè)衛(wèi)生福利數(shù)據(jù)中心(HWDC),該數(shù)據(jù)存儲(chǔ)站點(diǎn)集中了NHIRD和大約70個(gè)其他與健康相關(guān)的數(shù)據(jù)庫谦屑,用于數(shù)據(jù)管理和分析驳糯。為了加強(qiáng)對(duì)數(shù)據(jù)隱私的保護(hù),要求調(diào)查人員通過與MOHW服務(wù)器的遠(yuǎn)程連接在HWDC進(jìn)行現(xiàn)場分析氢橙。盡管對(duì)現(xiàn)場分析的嚴(yán)格規(guī)定給分析人員帶來了不便酝枢,并增加了研究所需的時(shí)間和成本,但HWDC通過將NHIRD與其他數(shù)據(jù)庫連接起來悍手,為豐富研究范圍創(chuàng)造了機(jī)會(huì)帘睦。在不久的將來,研究人員將有更大的機(jī)會(huì)通過使用包括機(jī)器學(xué)習(xí)和自然語言處理在內(nèi)的人工智能技術(shù)谓苟,從NHIRD提取與醫(yī)院電子病歷數(shù)據(jù)庫相關(guān)的知識(shí)官脓,該數(shù)據(jù)庫包含非結(jié)構(gòu)化的患者水平信息。我們相信涝焙,擁有多個(gè)數(shù)據(jù)源的NHIRD可以代表強(qiáng)大的研究引擎,具有豐富的維度孕暇,并且可以作為臺(tái)灣現(xiàn)實(shí)世界中循證醫(yī)學(xué)的指南仑撞。