國內(nèi)泛癌早篩產(chǎn)品梳理之甲基化靶向測序篇

醫(yī)學(xué)技術(shù)近幾十年有巨大進步牺弄，但是癌癥仍舊無法被攻克富雅。癌癥既然現(xiàn)有技術(shù)難以攻克，那么最好的方法就是及早發(fā)現(xiàn)陨收，及早治療饭豹。早期癌癥一般花幾萬塊錢做一個小手術(shù)將腫瘤切除就可痊愈，五年生存率基本上可達90%以上务漩，但是到了晚期拄衰，即使現(xiàn)在有很多昂貴的靶向藥可以大大改善患者生存狀況，但是也只是延長患者生存時間罷了饵骨，整體五年生存率不超過50%翘悉。NMPA（國家藥品監(jiān)督管理局）已經(jīng)批準了不少單癌癥診斷產(chǎn)品，主要了覆蓋了腸癌居触，肝癌妖混，肺癌等包吝。單癌癥產(chǎn)品一般基于qPCR平臺，成本低源葫，但一次只能檢測幾個靶點诗越，性能相對有限。
泛癌種早篩只用一管血（大概10mL）就可檢測多種癌癥息堂，可以說是癌癥早篩領(lǐng)域的明珠嚷狞。截止現(xiàn)在仍沒有NMPA批準的產(chǎn)品。泛癌種早篩產(chǎn)品一般基于NGS平臺荣堰，一次可以檢測成千上萬靶點床未，性能理論上更有保證，缺點是成本較高振坚，但是一次能準確檢測多個癌癥的話薇搁，分攤到單癌癥的成本其實不高，而且覆蓋人群較廣渡八。
本文只介紹有相關(guān)文章或者Abstract較為詳細數(shù)據(jù)支持的泛癌種產(chǎn)品啃洋，一些只自吹自擂產(chǎn)品性能，沒有詳細數(shù)據(jù)支持的自嗨產(chǎn)品不予考慮屎鳍，但是即使有相關(guān)文章或者Abstract數(shù)據(jù)支持宏娄，產(chǎn)品的性能數(shù)據(jù)也不一定完全可信，你懂得..這年頭會做PPT的太多了逮壁。孵坚。。
泛癌種早篩的技術(shù)路線主要有以下三個：甲基化靶向測序窥淆，低深度全基因組甲基化測序卖宠，低深度全基因組測序。

首先介紹甲基化靶向測序產(chǎn)品：甲基化靶向測序首先要篩選具有癌癥和組織溯源信號的甲基化標志物忧饭，篩選標志物一般使用盡可能覆蓋更多CpG位點的組織測序數(shù)據(jù)：比如450k/850k甲基化芯片數(shù)據(jù)扛伍，RRBS/WGBS測序數(shù)據(jù)，現(xiàn)有不少公共數(shù)據(jù)可下載使用眷昆，也可自己收集樣本進行測序分析蜒秤。篩選在血漿中具有顯著信號的標志物需要考慮眾多因素，這里只大概說一下亚斋，后續(xù)可以單獨寫一章作媚。篩選到的甲基化標志物就可以組成一個Panel，后續(xù)使用擴增子靶向捕獲測序或者探針靶向捕獲測序帅刊。這樣就可以用于血液cfDNA的檢測纸泡，在訓(xùn)練集血漿樣本的cfDNA甲基化數(shù)據(jù)中提取甲基化的相關(guān)特征構(gòu)建機器學(xué)習(xí)模型或者深度學(xué)習(xí)模型，構(gòu)建的好的模型再在真實世界中進行大規(guī)模前瞻性驗證赖瞒，只有在真實世界數(shù)據(jù)中達到預(yù)期才能稱為一個合格的泛癌早篩產(chǎn)品女揭。

國際領(lǐng)先的Grail公司的泛癌種早篩產(chǎn)品Galleri就是使用該路線蚤假，與之對標的國內(nèi)同樣使用該策略的公司是燃石醫(yī)學(xué)和鹍遠生物：燃石醫(yī)學(xué)：

燃石醫(yī)學(xué):
2021年啟動了兩個萬人前瞻性泛癌早篩臨床實驗PREDICT和PRESCIENT：兩個臨床實驗都是院士主導(dǎo)，計劃入組人數(shù)都在1萬+吧兔。除了參與者/合作醫(yī)院的差異磷仰，主要差異應(yīng)該還是覆蓋癌種數(shù)目的差異，PREDICT開發(fā)測試覆蓋≤10個主要高發(fā)癌癥早篩產(chǎn)品的性能境蔼；PRESCIENT開發(fā)測試覆蓋≥20個癌種早篩產(chǎn)品的性能灶平。自不必說，覆蓋癌癥越多箍土，收集樣本逢享，篩選甲基化標志物和建模就會更難，價格肯定會更高吴藻。

Figure 1.png

Figure 2.png

目前瞒爬，燃石已經(jīng)有上市的泛癌早篩產(chǎn)品—燃小安，是中國目前唯一進入NMPA創(chuàng)新審評通道的多癌種早期檢測產(chǎn)品沟堡，當然想要拿到正式證書還比較遠侧但。

該產(chǎn)品驗證文章[1]發(fā)表在了著名期刊ANNALS OF ONCOLOGY，影響因子高達50.5弦叶，覆蓋了6個癌種：腸癌俊犯，食管癌，肝癌伤哺，肺癌，卵巢癌和胰腺癌者祖。

Figure 3.png

研究路線見下圖立莉，其篩選甲基化標志物的數(shù)據(jù)是TCGA數(shù)據(jù)庫下載的組織樣本的450k芯片數(shù)據(jù)和從GEO數(shù)據(jù)庫下載的血細胞（WBC）450k芯片數(shù)據(jù)用來控制背景噪音，450k芯片雖然覆蓋了45萬個CpG位點七问，但是占人基因組全部CpG位點（2800萬+）不足1/60蜓耻，初始篩選標志物納入的位點就有些少。
從大量的450k公共數(shù)據(jù)中一共篩選到了14,415個CpG位點械巡，然后每個CpG位點上下游各外擴60bp刹淌，組成了包含7017個甲基化區(qū)域(161,984 CpG位點)的Panel，然后用自測的組織數(shù)據(jù)對這些標志物進行了驗證讥耗，根據(jù)文章描述：其中有507個高甲基化標志物和59個低甲基化標志物在6個癌種中都有顯著的癌癥信號有勾，2119個標志物在至少一個癌癥中具有顯著組織溯源信號, 應(yīng)該也會有不一致的標志物，但文章并未提及古程，Panel后續(xù)也未縮減蔼卡。

Figure 4.png

下一步在血漿樣本中進行建模和獨立驗證。在建模階段使用的回顧性研究樣本挣磨，樣本數(shù)目為700 cancers VS 914 non-cancers雇逞，訓(xùn)練集樣本進行了年齡匹配（就是Cancer與non-Cancer樣本的年齡分布一致荤懂，后續(xù)建模的話就不會帶入年齡信號，而是真正的甲基化信號）塘砸，6個癌種樣本數(shù)目大體一致节仿，早期（I/II期樣本）樣本占比在50%左右，甲基化特征的話文章只給了Methylation Region Score掉蔬，可大體理解為該區(qū)域的平均甲基化水平廊宪，癌癥模型和組織溯源模型分別使用了SVM（支持向量機模型）和邏輯回歸模型，較為簡單眉踱，都沒有使用深度學(xué)習(xí)模型挤忙。

Figure 5.png

Figure 6.png

最后就是獨立驗證階段，獨立驗證階段使用前瞻性收集的樣本谈喳，在此的一個操作我難以理解册烈，獨立驗證集總的樣本還是蠻多的（1433 cancers VS 1075 cancers），但是后續(xù)又在此基礎(chǔ)上進行了年齡匹配婿禽，最后用的樣本只有473 cancers vs 473 non-cancers赏僧。其在訓(xùn)練集建模時已經(jīng)進行了年齡匹配，構(gòu)建的模型理論上已經(jīng)沒有了年齡信號扭倾，為何在獨立驗證集還要繼續(xù)匹配年齡淀零。。膛壹。難道以后大規(guī)模應(yīng)用查看性能的話還要匹配年齡之后再看驾中。。模聋。那匹配年齡過程中被刪除的50%以上樣本就不管死活了么肩民。。
下面介紹一下該產(chǎn)品的主要性能指標：獨立驗證集中链方，98.9%的特異性下持痰，在6個癌癥中可以達到69.1%的敏感性，組織溯源準確率可達到83.2%祟蚀。但是對于單個癌種工窍，性能差異則較大，除了肝癌前酿，其它5個癌種I期的敏感性都很低（25%左右）患雏，II期患者敏感性稍高一些（食管癌/肺癌/胰腺癌敏感性仍只有35%左右）, I/II期患者應(yīng)是泛癌早篩產(chǎn)品最緊要的目標，性能還待提高薪者。TOO溯源的準確率I期患者也較低纵苛，只有65%；另外就是肺癌的組織溯源準確率只有61.8%遠低于其他癌種，性能也待提高攻人。明顯III/IV期患者拉高了整體的性能取试，晚期癌癥患者一般都會有了相關(guān)癥狀，常規(guī)篩查手段就可發(fā)現(xiàn)怀吻，根本不需要泛癌早篩產(chǎn)品瞬浓。

Figure 7.png

鹍遠生物：
鹍遠也有大型的前瞻性泛癌早篩臨床實驗-福聲計劃（FuSion），也是院士牽頭蓬坡，預(yù)計入組人數(shù)超過6萬人猿棉，覆蓋華東、華北屑咳、華南萨赁、西南等地區(qū)的10個省及直轄市，大手筆了兆龙。

Figure 8.png

Figure 9.png

關(guān)于泛癌種研究杖爽，迄今為止，鹍遠發(fā)表了兩個相關(guān)研究：2020年發(fā)表在Nature communications（IF=16.6）上的PanSeer的初步結(jié)果[2]和2023年的ASCO Abstract展示的GutSeer[3]紫皇，GutSeer應(yīng)該是PanSeer驗證成型的一個產(chǎn)品慰安。
首先介紹一下PanSeer的初步結(jié)果，覆蓋了5個癌癥（胃癌聪铺，食管癌化焕，結(jié)直腸癌，肺癌和肝癌）铃剔。甲基化標志物的篩選也使用的組織測序數(shù)據(jù)撒桨，但是相比燃石只使用甲基化芯片數(shù)據(jù)，鹍遠使用了更多來源的數(shù)據(jù)：甲基化芯片/WGBS/自測的RRBS數(shù)據(jù), 另外還納入了其它文獻報道的標志物键兜；但是只篩選了具有癌癥信號的甲基化標志物元莫，沒有篩選能夠組織溯源的標志物。雖然數(shù)據(jù)更多蝶押，但是只納入了595個甲基化區(qū)域，后續(xù)又在用自測的組織樣本對這些區(qū)域進行了驗證火欧，最后只留下了477個甲基化區(qū)域棋电，覆蓋了10,613個CpG位點，相比燃石的Panel要小很多苇侵。建模階段只使用了AMF（Average Methylation Fraction, 平均甲基化水平）特征赶盔，只構(gòu)建了癌癥模型，使用了簡單的邏輯回歸模型榆浓。
樣本來源的話全部是前瞻性收集的樣本于未，并根據(jù)確診時間對樣本進行了分組。性能：在96.1%的特異性下，敏感性可以達到87.6%, 不同確診時間分組中烘浦，都保持著超高的敏感性抖坪，所以文章宣稱提前四年可以發(fā)現(xiàn)癌癥信號，根據(jù)其模型分值的分布闷叉，并沒有發(fā)現(xiàn)早期與晚期敏感性的差異擦俐，不同癌癥之間敏感性的差異也沒有像燃石那么明顯。

Figure 10.png

Figure 11.png

下面再介紹一下鹍遠最新的GutSeer握侧，在此次Abstract并沒有詳細說明如何篩選的甲基化標志物蚯瞧，只說一共納入了1656個甲基化區(qū)域，應(yīng)該是在上述PanSeer 477個甲基化標志物的基礎(chǔ)上品擎，后續(xù)納入了一些組織溯源的甲基化標志物埋合，使用的建模特征，除了甲基化特征還納入了cfDNA的片段化信號（CNV萄传，endmotif）甚颂，模型也要更復(fù)雜一些，使用了集成模型（合并了多個不同模型的分值進行建模）盲再，但是并沒有展示詳細建模信息西设。
GutSeer覆蓋的癌種和PanSeer的初步結(jié)果有所差異，去除了肺癌答朋，新納入了胰腺癌贷揽，只檢測跨消化道的5個主要癌種。研究共招募1844名受試者（其中：健康人787例梦碗、肝癌342例禽绪、食管癌209例、胃癌239例洪规、結(jié)直腸癌180例印屁、胰腺癌87例），隨機分入訓(xùn)練集與測試集斩例。研究發(fā)現(xiàn)雄人，在測試集中GutSeer模型敏感性為86.2%，特異性為96.7%念赶，總體溯源準確率達到了82%础钠。同燃石的產(chǎn)品相比，犧牲了一定的特異性（96.7% vs 98.9%）叉谜，但是敏感性大幅提升（86.2% vs 69.1%）旗吁。肝癌同樣表現(xiàn)最好，敏感性最高停局，但是對于其它癌癥很钓，I/II期癌癥的敏感性相比燃石產(chǎn)品則要好很多香府，所有癌癥I/II期的敏感性都在50%以上，當然因為與燃石所納入癌種不一致码倦，樣本也不一致企孩，無法平行對比，并且GutSeer此處只是case-control研究結(jié)果叹洲，不是前瞻性盲測結(jié)果柠硕，后續(xù)還需在前瞻性驗證集進行盲測驗證。
有意思的是运提，此次GutSeer還與基于低深度全基因組測序（low-pass WGS）的方法進行了平行比對蝗柔，兩者在癌癥信號的檢測能力相近，但是組織溯源能力甲基化捕獲Panel要優(yōu)于WGS民泵。

Figure 12.png

基于后兩種路線的泛癌早篩產(chǎn)品路線（低深度全基因組甲基化測序癣丧，低深度全基因組測序），后續(xù)再單獨介紹栈妆。

Gao, Q., et al., Unintrusive multi-cancer detection by circulating cell-free DNA methylation sequencing (THUNDER): development and independent validation studies. Ann Oncol, 2023. 34(5): p. 486-495.
Chen, X., et al., Non-invasive early detection of cancer four years before conventional diagnosis using a blood test. Nat Commun, 2020. 11(1): p. 3475.
Yang, X.-R., et al., Detection and localization of gastrointestinal cancers based on multi-dimentional signatures from a single cfDNA targeted sequencing assay. 2023, American Society of Clinical Oncology.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末胁编，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子鳞尔，更是在濱河造成了極大的恐慌嬉橙，老刑警劉巖，帶你破解...
沈念sama閱讀 219,490評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件寥假，死亡現(xiàn)場離奇詭異市框，居然都是意外死亡，警方通過查閱死者的電腦和手機糕韧，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,581評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門枫振，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人萤彩，你說我怎么就攤上這事粪滤。” “怎么了雀扶？”我有些...
開封第一講書人閱讀 165,830評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵杖小，是天一觀的道長。經(jīng)常有香客問我愚墓，道長窍侧，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,957評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任转绷，我火速辦了婚禮，結(jié)果婚禮上硼啤，老公的妹妹穿的比我還像新娘议经。我一直安慰自己斧账，他們只是感情好，可當我...
茶點故事閱讀 67,974評論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布煞肾。她就那樣靜靜地躺著咧织，像睡著了一般。火紅的嫁衣襯著肌膚如雪籍救。梳的紋絲不亂的頭發(fā)上习绢，一...
開封第一講書人閱讀 51,754評論 1贊 307
城市分裂傳說
那天，我揣著相機與錄音蝙昙，去河邊找鬼闪萄。笑死，一個胖子當著我的面吹牛奇颠，可吹牛的內(nèi)容都是我干的败去。我是一名探鬼主播，決...
沈念sama閱讀 40,464評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼烈拒，長吁一口氣：“原來是場噩夢啊……” “哼圆裕！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起荆几，我...
開封第一講書人閱讀 39,357評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤吓妆，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后吨铸，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體行拢，經(jīng)...
沈念sama閱讀 45,847評論 1贊 317
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,995評論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年焊傅，在試婚紗的時候發(fā)現(xiàn)自己被綠了剂陡。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,137評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡狐胎，死狀恐怖鸭栖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情握巢，我是刑警寧澤晕鹊，帶...
沈念sama閱讀 35,819評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站暴浦，受9級特大地震影響溅话，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜歌焦，卻給世界環(huán)境...
茶點故事閱讀 41,482評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一飞几、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧独撇，春花似錦屑墨、人聲如沸躁锁。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,023評論 0贊 22
一樁弒父案卵史，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽战转。三九已至，卻和暖如春以躯，著一層夾襖步出監(jiān)牢的瞬間槐秧，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,149評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工忧设，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留刁标，地道東北人。一個月前我還...
沈念sama閱讀 48,409評論 3贊 373
代替公主和親
正文我出身青樓见转，卻偏偏與公主長得像命雀，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子斩箫，可洞房花燭夜當晚...
茶點故事閱讀 45,086評論 2贊 355

國內(nèi)泛癌早篩產(chǎn)品梳理之甲基化靶向測序篇

推薦閱讀更多精彩內(nèi)容