Nat Biotech |癌癥突變檢測中的最好做法建議
原創(chuàng)?存在一棵樹?圖靈基因?今天
收錄于話題#前沿分子生物學(xué)技術(shù)
撰文:存在一棵樹
IF=54.902
推薦度:?????
亮點(diǎn):
系統(tǒng)檢測了對成對的腫瘤-正常細(xì)胞系中的體細(xì)胞突變醇锚,以確定影響六個(gè)不同中心檢測再現(xiàn)性和準(zhǔn)確性的因素,從而利用基因組病理學(xué)知識總結(jié)出了一種檢測癌癥突變的新黃金標(biāo)準(zhǔn)梧喷。
2021年9月11日,美國FDA?Wenming Xiao及其他機(jī)構(gòu)與復(fù)旦大學(xué)基因工程國家重點(diǎn)實(shí)驗(yàn)室的石樂明教授在《Nature Biotechnology?》上發(fā)表了一篇名為“Toward best practice in cancer mutation detection with whole-genome and whole-exome sequencing”的文章货邓。開發(fā)了使用代表性細(xì)胞系參考樣本和數(shù)據(jù)集來評估性能的系統(tǒng)方法怎茫,并總結(jié)了最佳標(biāo)準(zhǔn)诊杆,以提高?NGS?癌癥突變檢測實(shí)驗(yàn)的可重復(fù)性和準(zhǔn)確性。
隨著成本不斷降低氓拼,越來越多的研究人員和臨床醫(yī)生正在使用?NGS?來分析臨床樣本你画,大量樣品處理協(xié)議、文庫制備方法桃漾、測序技術(shù)和生物信息學(xué)管道用于檢測與癌癥相關(guān)的突變坏匪。但腫瘤樣本的純度差異以及處理差異會使輸入的DNA數(shù)量改變,導(dǎo)致重復(fù)率低下撬统,這對在測序分析适滓、儀器和分析工具方面提出了重大挑戰(zhàn)。
如圖1所示恋追,方法設(shè)計(jì)用于捕捉影響癌癥突變檢測的非分析性和分析性因素凭迹。為確定影響體細(xì)胞變異調(diào)用的因素罚屋,選擇了一對匹配的乳腺癌細(xì)胞系(HCC1395?和HCC1395BL)進(jìn)行分析,生成了?1,015個(gè)調(diào)用子集來評估突變檢測的跨中心和跨平臺可重復(fù)性嗅绸,以及在各種條件下突變調(diào)用的性能脾猛。在該實(shí)驗(yàn)設(shè)計(jì)中涵蓋了研究或臨床實(shí)驗(yàn)室中發(fā)生的許多現(xiàn)實(shí)場景,包括?FFPE(福爾馬林固定石蠟包埋處理)鱼鸠、腫瘤活檢的異質(zhì)性猛拴、有限的樣本?DNA赵誓、不斷變化的?NGS?機(jī)器模型和分析工具涮雷。這里一共在6個(gè)測序中心進(jìn)行了全基因組測序(WGS)忱嘹,使用1,000ng的輸入?DNA?制備的標(biāo)準(zhǔn)?TruSeq PCR-free?文庫中總共產(chǎn)生了42個(gè)測序結(jié)果锣尉;跨平臺比較了HiSeq 4000、?HiSeq X10和NovaSeq S6000三種不同的平臺阳懂,由于測序平臺產(chǎn)量差異和運(yùn)行池計(jì)劃和目標(biāo)覆蓋率,每個(gè)樣本讀數(shù)的數(shù)量都發(fā)生了變化。類似地哥蔚,全外顯子組測序(WES)在6個(gè)測序中心(EA,F(xiàn)D蛛蒙,IL糙箍,LL,NC和NV)使用3種不同的?HiSeq?模型(HiSeq 1500牵祟,HiSeq 2500和?HiSeq 4000)產(chǎn)生測序結(jié)果深夯,其中99%的讀取成功映射。針對DNA質(zhì)量評價(jià)诺苹,利用GIV(常用的?DNA損傷指標(biāo))來監(jiān)測DNA質(zhì)量NGS運(yùn)行咕晋,發(fā)現(xiàn)在FFPE樣品WGS運(yùn)行中觀察到“劑量”依賴的GIV不平衡,意味WES比WGS對站點(diǎn)庫存準(zhǔn)備的變化更加敏感收奔,而WGS比?WES更適合于FFPE樣品掌呜。
如圖?2a所示,評估了?WES?和?WGS?檢測癌癥突變的可重復(fù)性坪哄。BWA?和?NovoAlign都展示了在由三個(gè)調(diào)用者(MuTect2质蕉、Strelka2?和?SomaticSniper)調(diào)用的每次重復(fù)WGS?或?WES?運(yùn)行下達(dá)成一致的大量調(diào)用,但使用?Bowtie2?作為對齊器的WGS調(diào)用結(jié)果往往比?BWA?和Novalign具有更少的一致單核苷酸變異?(SNV)?調(diào)用翩肌,表明來自Bowtie2?比對的突變調(diào)用是保守的模暗;隨后將對齊固定為廣泛使用的?BWA,比較三個(gè)調(diào)用者的結(jié)果念祭,觀察WES與?WGS?運(yùn)行性能的差異兑宇,發(fā)現(xiàn)Strelka2?在?WGS?重復(fù)運(yùn)行中具有最好的再現(xiàn)性,但在?WES?重復(fù)運(yùn)行中最差粱坤,而?MuTect2?在?WES?重復(fù)運(yùn)行中具有最好的再現(xiàn)性隶糕。
在建立了衡量?NGS?平臺突變檢測重復(fù)性的?O-score?方法之后祝钢,利用確定其影響癌癥基因突變檢測重復(fù)性的因素。發(fā)現(xiàn)只有少數(shù)幾個(gè)因素(讀覆蓋率和調(diào)用者)影響?WGS?的可重復(fù)性若厚,而調(diào)用者拦英、讀覆蓋率、插入片段大小测秸、GC?含量疤估、GIV?評分(g > t/c > a)及其相互作用等因素影響?WES?的可重復(fù)性。
為了深入研究非分析性和分析性因素對腫瘤突變召喚的影響霎冯,團(tuán)隊(duì)確定了細(xì)胞系HCC1395的體細(xì)胞突變調(diào)用子集作為基準(zhǔn)參考铃拇。如圖3所示,通過三種不同的文庫制備方案和多個(gè)文庫制備中不同的?DNA?輸入量沈撞,這里使用三個(gè)調(diào)用者和三個(gè)比對器的組合分析了結(jié)果慷荔,發(fā)現(xiàn)Nextera Flex?文庫制備可能是低輸入?DNA?數(shù)量的更好選擇。福爾馬林固定石蠟包埋處理(FFPE)對不同的調(diào)用結(jié)果有一定的影響缠俺,當(dāng)樣品經(jīng)過?FFPE?處理后显晶,mutetet2和?Strelka2的準(zhǔn)確率召回率都大大降低。
調(diào)用準(zhǔn)確性取決于調(diào)用者和對齊器的選擇以及他們之間的互動(dòng)壹士。如圖4所示磷雇,Strelka2是按照?BWA?校準(zhǔn)方法訓(xùn)練和建模的,因此在開發(fā)它的生物信息學(xué)環(huán)境中工作得最好躏救,表明對齊器和調(diào)用者之間可能存在聯(lián)合效應(yīng)唯笙,這取決于調(diào)用者的開發(fā)方式以及他們在哪個(gè)對齊者的數(shù)據(jù)集上接受訓(xùn)練;其次充分了解?NGS?方法的變異分析的各個(gè)組成部分如何工作和相互作用的重要性盒使;最后腫瘤樣本純度對于數(shù)據(jù)集調(diào)用的影響遠(yuǎn)超過本次的測試范圍崩掘。
最后,如圖5所示少办,WES?和?WGS?的準(zhǔn)確率和召回率也直接在所有三個(gè)調(diào)用者和所有12?次重復(fù)中進(jìn)行了比較苞慢。幾乎所有由?MuTect2?和?SomaticSniper?調(diào)用的突變都是正確的,而盡管利用額外的調(diào)用者提高了精確度凡泣,但這是以重復(fù)調(diào)用為代價(jià)的枉疼。表明在研究設(shè)計(jì)期間使用足夠的文庫重復(fù)的重要性,而不是試圖通過使用多個(gè)調(diào)用者來補(bǔ)償鞋拟。綜上骂维,根據(jù)精度指標(biāo),WGS?在重復(fù)贺纲、調(diào)用者和測序中心的表現(xiàn)明顯優(yōu)于?WES航闺。
綜上,這項(xiàng)研究提供了比較新鮮細(xì)胞?DNA、FFPE DNA?和腫瘤/正常?DNA?混合物的數(shù)據(jù)集以及各種生物信息學(xué)工具的性能潦刃。并在文中附上了參考表格侮措,提供了有關(guān)?WES?運(yùn)行的?DNA?片段化、基于可用生物樣本的性質(zhì)和研究目標(biāo)選擇?NGS?平臺和生物信息學(xué)工具的建議乖杠。
教授介紹
石樂明分扎,博士,2011年加入復(fù)旦大學(xué)胧洒,現(xiàn)任人類表型組研究院畏吓、生命科學(xué)學(xué)院和附屬腫瘤醫(yī)院教授。畢業(yè)于湖南大學(xué)(1985卫漫,學(xué)士菲饼,分析化學(xué))、中國科學(xué)技術(shù)大學(xué)(1988列赎,碩士宏悦,計(jì)算化學(xué))和中國科學(xué)院過程工程研究所(1991,博士包吝,計(jì)算化學(xué))饼煞,后留所任助研(1991)和副研(1993);1994-1997年于美國凱斯西儲大學(xué)和NIH/NCI?從事博士后研究漏策,1997-2001年在美國FDA派哲、Wyeth和BASF任職臼氨。2001年參與創(chuàng)辦生物科技公司掺喻,深圳微芯生物,其中1.1類原創(chuàng)新藥亞型選擇性HDACi西達(dá)本胺被中國FDA批準(zhǔn)用于治療T細(xì)胞淋巴瘤(2014)和乳腺癌(2019)储矩,新型胰島素增敏劑PPAR全激動(dòng)劑西格列他鈉已提交上市申請(2019)感耙。其研究方向?yàn)榛瘜W(xué)基因組學(xué)、藥物基因組學(xué)持隧、精準(zhǔn)醫(yī)學(xué)即硼、醫(yī)學(xué)大數(shù)據(jù)、生物信息學(xué)和化學(xué)信息學(xué)等屡拨,通過確保多組學(xué)數(shù)據(jù)產(chǎn)生只酥、分析和解讀的可重復(fù)性和可靠性,挖掘與疾病預(yù)防呀狼、診斷和治療相關(guān)的生物標(biāo)志物裂允,提高新藥研發(fā)成功率和藥物臨床使用有效率。
參考文獻(xiàn)
1哥艇、Xiao, W., Ren, L., Chen, Z. et al.Toward best practice in cancer mutation detection with whole-genome andwhole-exome sequencing.?Nat Biotechnol?39, 1141–1150 (2021).