作者剛開始接觸ECG AI的時(shí)候,第一件事情就是用谷歌學(xué)術(shù)檢索匆光,看到縱貫近40年的大量文章,F1分值往往逼近1酿联,這不就是個(gè)solved problem终息?可現(xiàn)實(shí)中,ECG還必須靠專業(yè)醫(yī)生讀圖贞让,豈非怪哉周崭?后來基于大量實(shí)際數(shù)據(jù),實(shí)現(xiàn)喳张、測(cè)試了幾乎各種有影響的算法和模型续镇,才發(fā)現(xiàn)個(gè)中緣由,回首前塵销部,頗有蕭瑟之感觸摸航。
數(shù)字化心電圖(ECG)記錄,表現(xiàn)為一維時(shí)序?qū)嵭盘?hào)柴墩,多導(dǎo)聯(lián)時(shí)忙厌,為一組信號(hào)。利用計(jì)算機(jī)對(duì)其進(jìn)行識(shí)別江咳,屬于機(jī)器學(xué)習(xí)中的分類問題:將某心電記錄歸入一個(gè)或多個(gè)類別——對(duì)應(yīng)診斷病種逢净,如“正常”歼指、“房顫”等爹土。
各種用于心電信號(hào)識(shí)別的人工智能技術(shù),無不具備“適合處理時(shí)序信號(hào)”和“以分類為目的”這兩個(gè)基本特征踩身。過去四十多年來這方面的實(shí)踐胀茵,大致可分成兩類:傳統(tǒng)機(jī)器學(xué)習(xí)、和深度學(xué)習(xí)挟阻。
(1)傳統(tǒng)機(jī)器學(xué)習(xí)琼娘。從二十世紀(jì)八、九十年代到現(xiàn)在附鸽,這類系統(tǒng)均可以歸結(jié)為一個(gè)簡(jiǎn)單的公式:系統(tǒng)=特征抽取+分類器脱拼。
特征抽取又可以分成信號(hào)處理和統(tǒng)計(jì)兩個(gè)步驟。信號(hào)處理包括:時(shí)域方法(如濾波坷备、模版匹配等)熄浓、頻域方法如傅立葉/加窗傅立葉變換、小波變換等省撑,也有采用Hilbert Huang變換的赌蔑。統(tǒng)計(jì)部分包括各種常用指標(biāo)如均值俯在、方差等,以及如峭度娃惯、相對(duì)熵等相對(duì)冷門一點(diǎn)的跷乐,這些指標(biāo)就作為抽取到的特征,輸入到分類器石景。
分類器則主要采用SVM或分類回歸樹(CART)劈猿,及其發(fā)展如Boosting等Ensemble方法〕蹦酰考慮到心電信號(hào)的時(shí)序特點(diǎn)揪荣,也有結(jié)合馬爾可夫過程、時(shí)序限制網(wǎng)絡(luò)等來予以增強(qiáng)的嘗試往史。另外仗颈,在某些特定場(chǎng)景下,也可以直接采用如 if/else 等簡(jiǎn)單規(guī)則椎例。
心電圖中挨决,QRS Complex最顯眼,也就是信噪比最高订歪。因此脖祈,曾有大量的研究致力于檢測(cè)R波,尤以Pan-Tompkins(P-T)刷晋、GQRS等算法為代表盖高。很多心電信號(hào)處理的算法,都先用P-T等來檢測(cè)R波眼虱,以此為基礎(chǔ)來抽取特征喻奥,例如最常見的R-R間隔等。
傳統(tǒng)機(jī)器學(xué)習(xí)方法用于心電信號(hào)識(shí)別捏悬,最主要的問題是冗澈,難于應(yīng)對(duì)不確定性(來源于噪聲和個(gè)體差異等)埃疫,以及較為嚴(yán)重的過擬合現(xiàn)象。絕大部分發(fā)表的文章龙考,在如MIT-BIH等小數(shù)據(jù)集上特笋,往往F1都可以達(dá)到0.95以上结榄,然而我們基于實(shí)際數(shù)據(jù)集的測(cè)試發(fā)現(xiàn)抱冷,F(xiàn)1通常在0.8以下汗菜。
(2)深度學(xué)習(xí)。過去五年的發(fā)展摧莽,主要是采用深度深度神經(jīng)網(wǎng)絡(luò)中的CNN、LSTM以及其后續(xù)發(fā)展如Attention機(jī)制等顿痪,適配于心電信號(hào)镊辕,大部分以1維CNN為基礎(chǔ)油够。和傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,深度學(xué)習(xí)不依賴于人工的特征抽取和分類器選擇征懈,常見的網(wǎng)絡(luò)模型石咬,本身就可以直接從原始信號(hào)給出最終分類結(jié)果。
深度學(xué)習(xí)飛速發(fā)展卖哎,在如ImageNet等上的表現(xiàn)已經(jīng)超過人類鬼悠,故人們對(duì)基于深度學(xué)習(xí)的心電信號(hào)識(shí)別寄予厚望。然而亏娜,從基于較大規(guī)模的數(shù)據(jù)集PhysioNet/CinC Challenge 2017, iCBEB/CPSC2018(記錄數(shù)分別為8K+焕窝,6K+)的結(jié)果來看,這種“厚望”還有待實(shí)現(xiàn)维贺。在CinC 2017中它掂,雄踞榜首的方法基于傳統(tǒng)的特征工程-分類器,CPSC2018列名第一的基于深度學(xué)習(xí)溯泣,然而在實(shí)際數(shù)據(jù)集測(cè)試中虐秋,F(xiàn)1下降了10%,只有0.77垃沦。實(shí)際上客给,從斯坦福大學(xué)文章(因作者來自吳恩達(dá)Andrew Ng團(tuán)隊(duì),該文在國(guó)內(nèi)影響很大)肢簿,便可知端倪靶剑,文中總的F1為0.809,但是除了“正骋胝蹋”等幾種類型的F1較高外抬虽,如“房顫”等主要病種的F1,都只是在0.6~0.7纵菌,難怪有人認(rèn)為文中對(duì)照組的“Cardiologist”得分太低阐污!該文章并沒有公開它所基于的訓(xùn)練集(64121條記錄),我們基于實(shí)際數(shù)據(jù)集的測(cè)試結(jié)果咱圆,General F1也大致在0.8以下笛辟。
關(guān)于(1)和(2)的結(jié)合,通常是利用Stacking等Ensemble方法序苏,也有讓深度神經(jīng)網(wǎng)絡(luò)不直接處理原始信號(hào)手幢,而是以信號(hào)處理后的輸出如頻譜圖、或者基于R波檢測(cè)后抽取的特征來作為神經(jīng)網(wǎng)絡(luò)的輸入忱详。這種結(jié)合围来,在CinC 2017和CPSC2018中都有例子,某些場(chǎng)景下能提高F1分值0.01~0.03左右。
最后监透,用這幅圖來總結(jié)人工智能處理心電圖的歷程桶错。經(jīng)驗(yàn)之談,僅供參考胀蛮。