隨著醫(yī)療衛(wèi)生信息化迅速發(fā)展
醫(yī)學研究正步入大數(shù)據(jù)時代
大數(shù)據(jù)的許多承諾正在醫(yī)療行業(yè)變成現(xiàn)實
大數(shù)據(jù)的實時處理和數(shù)據(jù)分析
可以讓醫(yī)療領(lǐng)域的從業(yè)者
更快更全面的做出決策和行動
該領(lǐng)域正在慢慢成熟
隨著云計算旁瘫、物聯(lián)網(wǎng)鹉胖、移動互聯(lián)網(wǎng)等新技術(shù)水平的提高军浆,各行各業(yè)所累計的數(shù)據(jù)已經(jīng)呈現(xiàn)指數(shù)級的增長闽坡∶枢郑“大數(shù)據(jù)” 時代已經(jīng)出現(xiàn)。
近年來岔留,大數(shù)據(jù)解決方案與大數(shù)據(jù)分析工具開始被廣泛運用于醫(yī)療衛(wèi)生領(lǐng)域庵佣。通過數(shù)據(jù),可以把醫(yī)學專家積累的寶貴經(jīng)驗婿斥,轉(zhuǎn)化成標準化的知識基礎劝篷,做到數(shù)據(jù)驅(qū)動醫(yī)療服務,因此從而大大提高服務能力和效率民宿,解決中國醫(yī)療領(lǐng)域存在的諸多需求娇妓。然而健康醫(yī)療大數(shù)據(jù)究竟指的是何種數(shù)據(jù)?其“大”又體現(xiàn)在何處活鹰?
一.大數(shù)據(jù)
大數(shù)據(jù)的類型大致可以分為以下兩種:
第一種類型是通過對海量數(shù)據(jù)進行分析哈恰,獲得巨大價值的產(chǎn)品、服務和見解志群,我們稱之為“動詞定義”着绷。
第二種類型是基于多源異構(gòu)、跨域關(guān)聯(lián)的海量數(shù)據(jù)(數(shù)據(jù)量锌云、數(shù)據(jù)形態(tài)荠医、數(shù)據(jù)分析處理方式),通過分析所產(chǎn)生的決策流程、商業(yè)模式彬向、科學范式兼贡、生活方式和觀念形態(tài)上的顛覆性變化的總和,我們稱之為“名詞定義”娃胆。
二.醫(yī)療數(shù)據(jù)
醫(yī)生對患者診療和治療過程中產(chǎn)生的數(shù)據(jù)遍希,包括患者的基本數(shù)據(jù)、電子病歷里烦、診療數(shù)據(jù)凿蒜、醫(yī)學影像數(shù)據(jù)、醫(yī)學管理胁黑、經(jīng)濟數(shù)據(jù)篙程、醫(yī)療設備和儀器數(shù)據(jù)等,以患者為中心别厘,成為醫(yī)療數(shù)據(jù)的主要來源。
三.醫(yī)療數(shù)據(jù)來源
首先來講拥诡,“醫(yī)療數(shù)據(jù)”的主要來源有四個方面触趴,第一種是患者就醫(yī),第二種是臨床研究和科研渴肉,第三種是生命制藥冗懦,第四種是可穿戴設備。
第一種“患者就醫(yī)”仇祭,源于患者披蕉,患者的體征數(shù)據(jù)、患者的化驗數(shù)據(jù)乌奇、患者的描述没讲,患者的住院數(shù)據(jù)、醫(yī)生對患者的問診數(shù)據(jù)礁苗、醫(yī)生對患者的臨床診治爬凑、用藥、手術(shù)等數(shù)據(jù)试伙。
第二種“臨床研究和科研”主要是實驗中產(chǎn)生的數(shù)據(jù)嘁信,也包含患者產(chǎn)生的數(shù)據(jù)。
第三種“生命制藥”主要是實驗產(chǎn)生的數(shù)據(jù)疏叨,與用藥相關(guān)的用藥量潘靖,用藥時間,用藥成分蚤蔓,實驗對象反應時間卦溢,癥狀改善表象等數(shù)據(jù),與生命等基因組學相關(guān)的數(shù)據(jù)。
第四種“可穿戴設備”主要通過各種穿戴設備(手環(huán)既绕、起搏器啄刹、眼鏡等)收集人體的各種體征數(shù)據(jù)。
四.醫(yī)療數(shù)據(jù)特性
醫(yī)療數(shù)據(jù)首先它屬于數(shù)據(jù)的一種凄贩,所以其大數(shù)據(jù)也必定具備一般的數(shù)據(jù)特性:規(guī)模大誓军、結(jié)構(gòu)多樣、增長快速疲扎、價值巨大昵时,但是其作為醫(yī)療領(lǐng)域產(chǎn)生的數(shù)據(jù)也同樣具備醫(yī)療性:多態(tài)性、不完整性椒丧、冗余性壹甥、時間性、隱私性壶熏。
多態(tài)性:醫(yī)療數(shù)據(jù)包含有像化驗產(chǎn)生的純數(shù)據(jù)句柠,也會有像體檢產(chǎn)生的圖像數(shù)據(jù)類似心電圖等信號圖譜,醫(yī)生對患者的癥狀描述以及跟進自己經(jīng)驗或者數(shù)據(jù)結(jié)果做出的判斷等文字描述棒假,另外還有像心跳聲溯职,哭聲,咳嗽聲等類似的聲音資料帽哑,同時現(xiàn)代醫(yī)院的數(shù)據(jù)中還有各種動畫數(shù)據(jù)(像胎動的影像等)谜酒。
不完整性:由于各種原因?qū)е掠泻芏噌t(yī)學數(shù)據(jù)是不完整的,像醫(yī)生的主觀判斷以及文字描述的不完整妻枕,患者治療中斷導致的數(shù)據(jù)不完整僻族,患者描述不清導致的數(shù)據(jù)不完整等。
冗余性:醫(yī)療數(shù)據(jù)量巨大屡谐,每天會產(chǎn)生大量多余的數(shù)據(jù)述么,這給數(shù)據(jù)分析的篩選帶來了很大困難。
時間性:大多醫(yī)療數(shù)據(jù)都是具有時間性愕掏、持續(xù)性的碉输,像心電圖,胎動思維圖均屬于時間維度內(nèi)的數(shù)據(jù)變化圖譜亭珍。
隱私性:隱私性也是醫(yī)療數(shù)據(jù)的一個重要特性敷钾,同時也是現(xiàn)在大部分醫(yī)療數(shù)據(jù)不愿對外開放的一個原因,很多醫(yī)院的臨床數(shù)據(jù)系統(tǒng)都是相對獨立的局域網(wǎng)絡肄梨,甚至不會去對外聯(lián)網(wǎng)阻荒。
五、數(shù)據(jù)的處理
數(shù)據(jù)的處理一般分為6個步驟:挖掘數(shù)據(jù)众羡、收集數(shù)據(jù)侨赡、分析數(shù)據(jù)、存儲數(shù)據(jù)、數(shù)據(jù)轉(zhuǎn)化實用羊壹,最終在實用過程中產(chǎn)生數(shù)據(jù)蓖宦,如此循環(huán)。
六.醫(yī)療大數(shù)據(jù)的用途
醫(yī)療大數(shù)據(jù)的主要用途有:用藥分析油猫、病因分析稠茂、移動醫(yī)療、基因組學情妖、疾病預防睬关、可穿戴醫(yī)療等。
隨著醫(yī)療大數(shù)據(jù)的發(fā)展和分析方法毡证、人工智能等技術(shù)的不斷革新电爹,能夠準確利用醫(yī)療大數(shù)據(jù)來進行分析和預測的場景會越來越多,到時大數(shù)據(jù)將會成為醫(yī)療決策的一種重要輔助依據(jù)料睛。
七.醫(yī)療大數(shù)據(jù)
醫(yī)療大數(shù)據(jù)企業(yè)主要分為三類:慢病及健康管理(輔助患者)丐箩、臨床決策支持(輔助醫(yī)生)、醫(yī)藥研發(fā)恤煞。
醫(yī)療大數(shù)據(jù)的服務對象主要有:居民屎勘、醫(yī)生、科研阱州、管理機構(gòu)、公眾健康法梯。
醫(yī)療大數(shù)據(jù)的主要用途有:用藥分析苔货、病因分析、移動醫(yī)療立哑、基因組學夜惭、疾病預防、可穿戴醫(yī)療等铛绰。
八.統(tǒng)計學在醫(yī)療方面的運用
統(tǒng)計學是醫(yī)學科學研究的重要工具诈茧,運用概率論與數(shù)理統(tǒng)計的原理及方法,結(jié)合醫(yī)學實際捂掰,研究數(shù)字資料的搜集敢会、整進行理分析與推斷。正確的統(tǒng)計分析能夠幫助人們正確認識客觀事物的規(guī)律性这嚣,做到胸中有數(shù)鸥昏,有的放矢地開展工作,提高工作質(zhì)量姐帚。
在統(tǒng)計分析領(lǐng)域中吏垮,有一種用途極其廣泛的特征曲線,叫做接受者操作特性曲線。
得此名的原因在于曲線上各點反映著相同的感受性膳汪,它們都是對同一信號刺激的反應唯蝶,只不過是在幾種不同的判定標準下所得的結(jié)果而已。
接受者操作特性曲線就是以虛驚概率為橫軸遗嗽,擊中概率為縱軸所組成的坐標圖粘我,和被試在特定刺激條件下由于采用不同的判斷標準得出的不同結(jié)果畫出的曲線。
在統(tǒng)計學中常講到的AUC就是”Area Under the ROC curve“媳谁,它的值是介于0.1到1之間涂滴,是當前分類算法根據(jù)計算所得的一個score值,AUC值越大說明正樣本越有可能排在負樣本之前晴音,從而能更好進行統(tǒng)計樣本的分類柔纵。
在現(xiàn)有的一個統(tǒng)計學方法中,我們對樣本的診斷通常是分為兩類锤躁,一個是健康類搁料,另一類是得病類。除了這兩類以外系羞,還存在一種人群叫亞健康人群郭计,如果我們還是按照原有的方法去給病人進行分類的話,那么我們所得到的一些結(jié)果可能是具有誤導性的椒振。
在統(tǒng)計學中概率樣本的置信區(qū)間是對樣本的某個總體參數(shù)的區(qū)間昭伸,估計通常來說,比如說我們說有95%的置信區(qū)間澎迎,那么就是說測試者有95%的統(tǒng)計量是落在置信區(qū)間內(nèi)的庐杨。
它其實展示了這個參數(shù)的真實值,有一定概率落在測試結(jié)果周圍的一個程度夹供,也給出被測量參數(shù)測試測量值的一個可信程度灵份。
怎么去判斷這個診斷的一個精確性,我們需要看的是置信區(qū)間的一個覆蓋率哮洽,如果這個覆蓋率越接近于既定的一個概率的話填渠,那么這個方法就越精確。
廣泛搜尋鸟辅,就是把所有的值結(jié)合在一起氛什,然后去比較它們之間的大小,用這種比對的方法來找出最大的不同匪凉。
如此可見屉更,隨著醫(yī)療服務提供者越來越善于從患者數(shù)據(jù)中提取有意義的見解,他們也將學習更好的提供治療的方法洒缀,提高服務質(zhì)量瑰谜。隨著大數(shù)據(jù)技術(shù)領(lǐng)域的成熟欺冀,許多組織將受益于運營的改善、費用的降低和健康狀況的改善萨脑。
通過許多方式隐轩,大數(shù)據(jù)和人工智能可以幫助解決日益嚴重的護理提供者短缺問題。醫(yī)療服務提供商也將充分利用大數(shù)據(jù)技術(shù)為醫(yī)療技術(shù)框架持續(xù)提供動力渤早。