醫(yī)學(xué)技術(shù)近幾十年有巨大進步牺弄,但是癌癥仍舊無法被攻克富雅。癌癥既然現(xiàn)有技術(shù)難以攻克,那么最好的方法就是及早發(fā)現(xiàn)陨收,及早治療饭豹。早期癌癥一般花幾萬塊錢做一個小手術(shù)將腫瘤切除就可痊愈,五年生存率基本上可達90%以上务漩,但是到了晚期拄衰,即使現(xiàn)在有很多昂貴的靶向藥可以大大改善患者生存狀況,但是也只是延長患者生存時間罷了饵骨,整體五年生存率不超過50%翘悉。NMPA(國家藥品監(jiān)督管理局)已經(jīng)批準了不少單癌癥診斷產(chǎn)品,主要了覆蓋了腸癌居触,肝癌妖混,肺癌等包吝。單癌癥產(chǎn)品一般基于qPCR平臺,成本低源葫,但一次只能檢測幾個靶點诗越,性能相對有限。
泛癌種早篩只用一管血(大概10mL)就可檢測多種癌癥息堂,可以說是癌癥早篩領(lǐng)域的明珠嚷狞。截止現(xiàn)在仍沒有NMPA批準的產(chǎn)品。泛癌種早篩產(chǎn)品一般基于NGS平臺荣堰,一次可以檢測成千上萬靶點床未,性能理論上更有保證,缺點是成本較高振坚,但是一次能準確檢測多個癌癥的話薇搁,分攤到單癌癥的成本其實不高,而且覆蓋人群較廣渡八。
本文只介紹有相關(guān)文章或者Abstract較為詳細數(shù)據(jù)支持的泛癌種產(chǎn)品啃洋,一些只自吹自擂產(chǎn)品性能,沒有詳細數(shù)據(jù)支持的自嗨產(chǎn)品不予考慮屎鳍,但是即使有相關(guān)文章或者Abstract數(shù)據(jù)支持宏娄,產(chǎn)品的性能數(shù)據(jù)也不一定完全可信,你懂得..這年頭會做PPT的太多了逮壁。孵坚。。
泛癌種早篩的技術(shù)路線主要有以下三個:甲基化靶向測序窥淆,低深度全基因組甲基化測序卖宠,低深度全基因組測序。
首先介紹甲基化靶向測序產(chǎn)品:甲基化靶向測序首先要篩選具有癌癥和組織溯源信號的甲基化標志物忧饭,篩選標志物一般使用盡可能覆蓋更多CpG位點的組織測序數(shù)據(jù):比如450k/850k甲基化芯片數(shù)據(jù)扛伍,RRBS/WGBS測序數(shù)據(jù),現(xiàn)有不少公共數(shù)據(jù)可下載使用眷昆,也可自己收集樣本進行測序分析蜒秤。篩選在血漿中具有顯著信號的標志物需要考慮眾多因素,這里只大概說一下亚斋,后續(xù)可以單獨寫一章作媚。篩選到的甲基化標志物就可以組成一個Panel,后續(xù)使用擴增子靶向捕獲測序或者探針靶向捕獲測序帅刊。這樣就可以用于血液cfDNA的檢測纸泡,在訓(xùn)練集血漿樣本的cfDNA甲基化數(shù)據(jù)中提取甲基化的相關(guān)特征構(gòu)建機器學(xué)習(xí)模型或者深度學(xué)習(xí)模型,構(gòu)建的好的模型再在真實世界中進行大規(guī)模前瞻性驗證赖瞒,只有在真實世界數(shù)據(jù)中達到預(yù)期才能稱為一個合格的泛癌早篩產(chǎn)品女揭。
國際領(lǐng)先的Grail公司的泛癌種早篩產(chǎn)品Galleri就是使用該路線蚤假,與之對標的國內(nèi)同樣使用該策略的公司是燃石醫(yī)學(xué)和鹍遠生物:燃石醫(yī)學(xué):
燃石醫(yī)學(xué):
2021年啟動了兩個萬人前瞻性泛癌早篩臨床實驗PREDICT和PRESCIENT:兩個臨床實驗都是院士主導(dǎo),計劃入組人數(shù)都在1萬+吧兔。除了參與者/合作醫(yī)院的差異磷仰,主要差異應(yīng)該還是覆蓋癌種數(shù)目的差異,PREDICT開發(fā)測試覆蓋≤10個主要高發(fā)癌癥早篩產(chǎn)品的性能境蔼;PRESCIENT開發(fā)測試覆蓋≥20個癌種早篩產(chǎn)品的性能灶平。自不必說,覆蓋癌癥越多箍土,收集樣本逢享,篩選甲基化標志物和建模就會更難,價格肯定會更高吴藻。
目前瞒爬,燃石已經(jīng)有上市的泛癌早篩產(chǎn)品—燃小安,是中國目前唯一進入NMPA創(chuàng)新審評通道的多癌種早期檢測產(chǎn)品沟堡,當然想要拿到正式證書還比較遠侧但。
該產(chǎn)品驗證文章[1]發(fā)表在了著名期刊ANNALS OF ONCOLOGY,影響因子高達50.5弦叶,覆蓋了6個癌種:腸癌俊犯,食管癌,肝癌伤哺,肺癌,卵巢癌和胰腺癌者祖。
研究路線見下圖立莉,其篩選甲基化標志物的數(shù)據(jù)是TCGA數(shù)據(jù)庫下載的組織樣本的450k芯片數(shù)據(jù)和從GEO數(shù)據(jù)庫下載的血細胞(WBC)450k芯片數(shù)據(jù)用來控制背景噪音,450k芯片雖然覆蓋了45萬個CpG位點七问,但是占人基因組全部CpG位點(2800萬+)不足1/60蜓耻,初始篩選標志物納入的位點就有些少。
從大量的450k公共數(shù)據(jù)中一共篩選到了14,415個CpG位點械巡,然后每個CpG位點上下游各外擴60bp刹淌,組成了包含7017個甲基化區(qū)域(161,984 CpG位點)的Panel,然后用自測的組織數(shù)據(jù)對這些標志物進行了驗證讥耗,根據(jù)文章描述:其中有507個高甲基化標志物和59個低甲基化標志物在6個癌種中都有顯著的癌癥信號有勾,2119個標志物在至少一個癌癥中具有顯著組織溯源信號, 應(yīng)該也會有不一致的標志物,但文章并未提及古程,Panel后續(xù)也未縮減蔼卡。
下一步在血漿樣本中進行建模和獨立驗證。在建模階段使用的回顧性研究樣本挣磨,樣本數(shù)目為700 cancers VS 914 non-cancers雇逞,訓(xùn)練集樣本進行了年齡匹配(就是Cancer與non-Cancer樣本的年齡分布一致荤懂,后續(xù)建模的話就不會帶入年齡信號,而是真正的甲基化信號)塘砸,6個癌種樣本數(shù)目大體一致节仿,早期(I/II期樣本)樣本占比在50%左右,甲基化特征的話文章只給了Methylation Region Score掉蔬,可大體理解為該區(qū)域的平均甲基化水平廊宪,癌癥模型和組織溯源模型分別使用了SVM(支持向量機模型)和邏輯回歸模型,較為簡單眉踱,都沒有使用深度學(xué)習(xí)模型挤忙。
最后就是獨立驗證階段,獨立驗證階段使用前瞻性收集的樣本谈喳,在此的一個操作我難以理解册烈,獨立驗證集總的樣本還是蠻多的(1433 cancers VS 1075 cancers),但是后續(xù)又在此基礎(chǔ)上進行了年齡匹配婿禽,最后用的樣本只有473 cancers vs 473 non-cancers赏僧。其在訓(xùn)練集建模時已經(jīng)進行了年齡匹配,構(gòu)建的模型理論上已經(jīng)沒有了年齡信號扭倾,為何在獨立驗證集還要繼續(xù)匹配年齡淀零。。膛壹。難道以后大規(guī)模應(yīng)用查看性能的話還要匹配年齡之后再看驾中。。模聋。那匹配年齡過程中被刪除的50%以上樣本就不管死活了么肩民。。
下面介紹一下該產(chǎn)品的主要性能指標:獨立驗證集中链方,98.9%的特異性下持痰,在6個癌癥中可以達到69.1%的敏感性, 組織溯源準確率可達到83.2%祟蚀。但是對于單個癌種工窍,性能差異則較大,除了肝癌前酿,其它5個癌種I期的敏感性都很低(25%左右)患雏,II期患者敏感性稍高一些(食管癌/肺癌/胰腺癌敏感性仍只有35%左右), I/II期患者應(yīng)是泛癌早篩產(chǎn)品最緊要的目標,性能還待提高薪者。TOO溯源的準確率I期患者也較低纵苛,只有65%;另外就是肺癌的組織溯源準確率只有61.8%遠低于其他癌種,性能也待提高攻人。明顯III/IV期患者拉高了整體的性能取试,晚期癌癥患者一般都會有了相關(guān)癥狀,常規(guī)篩查手段就可發(fā)現(xiàn)怀吻,根本不需要泛癌早篩產(chǎn)品瞬浓。
鹍遠生物:
鹍遠也有大型的前瞻性泛癌早篩臨床實驗-福聲計劃(FuSion),也是院士牽頭蓬坡,預(yù)計入組人數(shù)超過6萬人猿棉,覆蓋華東、華北屑咳、華南萨赁、西南等地區(qū)的10個省及直轄市,大手筆了兆龙。
關(guān)于泛癌種研究杖爽,迄今為止,鹍遠發(fā)表了兩個相關(guān)研究:2020年發(fā)表在Nature communications(IF=16.6)上的PanSeer的初步結(jié)果[2]和2023年的ASCO Abstract展示的GutSeer[3]紫皇,GutSeer應(yīng)該是PanSeer驗證成型的一個產(chǎn)品慰安。
首先介紹一下PanSeer的初步結(jié)果,覆蓋了5個癌癥(胃癌聪铺,食管癌化焕,結(jié)直腸癌,肺癌和肝癌)铃剔。甲基化標志物的篩選也使用的組織測序數(shù)據(jù)撒桨,但是相比燃石只使用甲基化芯片數(shù)據(jù),鹍遠使用了更多來源的數(shù)據(jù):甲基化芯片/WGBS/自測的RRBS數(shù)據(jù), 另外還納入了其它文獻報道的標志物键兜;但是只篩選了具有癌癥信號的甲基化標志物元莫,沒有篩選能夠組織溯源的標志物。雖然數(shù)據(jù)更多蝶押,但是只納入了595個甲基化區(qū)域,后續(xù)又在用自測的組織樣本對這些區(qū)域進行了驗證火欧,最后只留下了477個甲基化區(qū)域棋电,覆蓋了10,613個CpG位點,相比燃石的Panel要小很多苇侵。建模階段只使用了AMF(Average Methylation Fraction, 平均甲基化水平)特征赶盔,只構(gòu)建了癌癥模型,使用了簡單的邏輯回歸模型榆浓。
樣本來源的話全部是前瞻性收集的樣本于未,并根據(jù)確診時間對樣本進行了分組。性能:在96.1%的特異性下,敏感性可以達到87.6%, 不同確診時間分組中烘浦,都保持著超高的敏感性抖坪,所以文章宣稱提前四年可以發(fā)現(xiàn)癌癥信號,根據(jù)其模型分值的分布闷叉,并沒有發(fā)現(xiàn)早期與晚期敏感性的差異擦俐,不同癌癥之間敏感性的差異也沒有像燃石那么明顯。
下面再介紹一下鹍遠最新的GutSeer握侧,在此次Abstract并沒有詳細說明如何篩選的甲基化標志物蚯瞧,只說一共納入了1656個甲基化區(qū)域,應(yīng)該是在上述PanSeer 477個甲基化標志物的基礎(chǔ)上品擎,后續(xù)納入了一些組織溯源的甲基化標志物埋合,使用的建模特征,除了甲基化特征還納入了cfDNA的片段化信號(CNV萄传,endmotif)甚颂,模型也要更復(fù)雜一些,使用了集成模型(合并了多個不同模型的分值進行建模)盲再,但是并沒有展示詳細建模信息西设。
GutSeer覆蓋的癌種和PanSeer的初步結(jié)果有所差異,去除了肺癌答朋,新納入了胰腺癌贷揽,只檢測跨消化道的5個主要癌種。研究共招募1844名受試者(其中:健康人787例梦碗、肝癌342例禽绪、食管癌209例、胃癌239例洪规、結(jié)直腸癌180例印屁、胰腺癌87例),隨機分入訓(xùn)練集與測試集斩例。研究發(fā)現(xiàn)雄人,在測試集中GutSeer模型敏感性為86.2%,特異性為96.7%念赶,總體溯源準確率達到了82%础钠。同燃石的產(chǎn)品相比,犧牲了一定的特異性(96.7% vs 98.9%)叉谜,但是敏感性大幅提升(86.2% vs 69.1%)旗吁。肝癌同樣表現(xiàn)最好,敏感性最高停局,但是對于其它癌癥很钓,I/II期癌癥的敏感性相比燃石產(chǎn)品則要好很多香府,所有癌癥I/II期的敏感性都在50%以上,當然因為與燃石所納入癌種不一致码倦,樣本也不一致企孩,無法平行對比,并且GutSeer此處只是case-control研究結(jié)果叹洲,不是前瞻性盲測結(jié)果柠硕,后續(xù)還需在前瞻性驗證集進行盲測驗證。
有意思的是运提,此次GutSeer還與基于低深度全基因組測序(low-pass WGS)的方法進行了平行比對蝗柔,兩者在癌癥信號的檢測能力相近,但是組織溯源能力甲基化捕獲Panel要優(yōu)于WGS民泵。
基于后兩種路線的泛癌早篩產(chǎn)品路線(低深度全基因組甲基化測序癣丧,低深度全基因組測序),后續(xù)再單獨介紹栈妆。
- Gao, Q., et al., Unintrusive multi-cancer detection by circulating cell-free DNA methylation sequencing (THUNDER): development and independent validation studies. Ann Oncol, 2023. 34(5): p. 486-495.
- Chen, X., et al., Non-invasive early detection of cancer four years before conventional diagnosis using a blood test. Nat Commun, 2020. 11(1): p. 3475.
- Yang, X.-R., et al., Detection and localization of gastrointestinal cancers based on multi-dimentional signatures from a single cfDNA targeted sequencing assay. 2023, American Society of Clinical Oncology.