Hackl, H., Charoentong, P., Finotello, F., & Trajanoski, Z. (2016). Computational genomics tools for dissecting tumour-immune cell interactions.?Nature Reviews Genetics,?17(8), 441.
摘要:
癌癥免疫療法方面的突破和高通量技術(shù)成本的降低,引發(fā)了使用基因組工具對腫瘤免疫細胞相互作用的深入研究灯抛。 數(shù)據(jù)的豐富性和復(fù)雜性帶來了相當大的挑戰(zhàn),需要計算工具來處理赚瘦、分析和實現(xiàn)可視化。 近年來湿故,研究人員已經(jīng)開發(fā)各種用于挖掘腫瘤免疫和基因組數(shù)據(jù)的工具并提供新穎的機制解讀碉京。本文我們將綜述用于癌癥免疫研究的各類計算基因組學(xué)工具猜绣,并提供有關(guān)要求和功能的信息。
關(guān)鍵詞:
正文:
癌癥免疫療法基于誘導(dǎo)或增強對癌癥的免疫應(yīng)答的藥劑霹俺。 目前柔吼,除了靶向癌細胞的單克隆抗體外,單一療法還基于三種策略:使用檢查點阻斷劑丙唧,接種新抗原和過繼性T細胞轉(zhuǎn)移愈魏。 另外,免疫單一療法的組合以及免疫療法和靶向療法的組合也正在研究中艇棕。
癌癥免疫療法有可能適應(yīng)腫瘤的變化蝌戒,因為免疫系統(tǒng)能促進特定的T細胞的產(chǎn)生,識別腫瘤表面發(fā)生改變的抗原從而殺死腫瘤細胞沼琉。然而北苟,腫瘤細胞可以通過上調(diào)免疫細胞表面的免疫檢查點分子,如細胞毒性T淋巴細胞相關(guān)蛋白4(CTLA4)或程序性細胞死亡分子1(PD1)來逃避免疫系統(tǒng)的檢測打瘪。最近友鼻,已經(jīng)引入了幾種阻斷免疫檢查點并由此增強抗腫瘤T細胞應(yīng)答的抗體,并顯示出顯著的臨床效果闺骚。接受CTLA4靶向抗體治療的黑色素瘤患者彩扔,3年后存活曲線達到平臺期,表明這種方法持久的益處甚至治愈潛力僻爽。此外虫碉,PD1靶向抗體的功效不僅在黑色素瘤中顯示,而且在九種不同的腫瘤類型中也顯示出來胸梆,如非小細胞肺癌敦捧,肝癌,腎癌和淋巴癌7碰镜。我們目前正在目睹檢查點阻滯劑的快速發(fā)展兢卵,從150多項臨床試驗中可以看出,它們被用在單一療法或聯(lián)合治療中7绪颖。然而秽荤,只有一小部分患者對檢查點阻滯劑的單一療法有反應(yīng),因此確定精確的作用模式和預(yù)測標志物是需要深入研究的主題。
繼第一批癌癥免疫療法 - 即單克隆抗體的使用窃款,以及檢查點阻斷劑免疫療法的開發(fā)课兄,和其他免疫治療策略,包括治療性疫苗和工程化T細胞雁乡,使得腫瘤 - 免疫細胞相互作用成為焦點第喳。解析這些復(fù)雜的相互作用,有望鑒定預(yù)測性生物標志物踱稍,發(fā)展新藥或新的治療手段,并且促進機制研究悠抹。然而珠月,由于這兩種多細胞生態(tài)系統(tǒng)的演變和異質(zhì)性,使得腫瘤-免疫細胞相互作用的研究具有相當大的挑戰(zhàn):癌癥的發(fā)展楔敌,可以看作是一種進化過程啤挎;免疫系統(tǒng),包含許多先天和適應(yīng)性免疫細胞亞群卵凑,其中一些表現(xiàn)出表型可塑性并具有記憶庆聘。NGS技術(shù)和其他中高通量技術(shù)正在產(chǎn)生大量數(shù)據(jù),需要信息系統(tǒng)來處理和分析數(shù)據(jù)勺卢,提取信息以開發(fā)機制理論并支持臨床決策伙判。因此,癌癥免疫基因組學(xué)也可以被視為信息科學(xué)黑忱,并將為新型免疫治療策略的開發(fā)和成功應(yīng)用鋪平道路宴抚。
在本綜述中,我們首先簡要介紹腫瘤-免疫細胞的相互作用甫煞,然后討論用于挖掘癌癥基因組數(shù)據(jù)和提取免疫參數(shù)的計算基因組學(xué)工具菇曲。 我們專注于對NGS數(shù)據(jù)的更高級別分析,包括腫瘤浸潤淋巴細胞(TILs)的定量抚吠,腫瘤抗原的鑒定和T細胞受體(TCRs)的分析常潮,并提供有關(guān)需求和功能的信息以幫助選擇工具和分析管道的組裝。 雖然這里的重點是癌癥免疫學(xué)楷力,但所討論的計算方法也為研究其他疾病提供了手段喊式,如自身免疫,炎癥弥雹,感染或移植物抗宿主疾病垃帅。
腫瘤-免疫細胞互作
癌癥免疫循環(huán)包括幾個連續(xù)步驟:癌細胞產(chǎn)生的新抗原在癌細胞死亡后釋放并被樹突細胞捕獲。 接下來剪勿,樹突細胞將主要組織相容性復(fù)合物(MHC)分子上捕獲的抗原呈遞給T細胞贸诚,導(dǎo)致針對癌癥特異性抗原的效應(yīng)T細胞應(yīng)答的引發(fā)和活化。 在趨化因子梯度的指導(dǎo)下,活化的T細胞進入并滲入腫瘤部位酱固。 T細胞通過T細胞受體(TCR)和新抗原-MHC復(fù)合物之間的相互作用特異性識別并結(jié)合癌細胞并殺死癌細胞(細胞溶解活性)械念。 各種分子和基因組學(xué)工具可用于評估這些癌癥免疫細胞相互作用的每個階段及其刺激或抑制因子。
組學(xué)數(shù)據(jù)分析概述
NGS技術(shù)在基因組运悲,轉(zhuǎn)錄組或表觀基因組分析中的應(yīng)用是腫瘤免疫基因組學(xué)數(shù)據(jù)的主要來源龄减。此外,最近在圖像技術(shù)和相關(guān)軟件工具以及細胞表型分析技術(shù)方面取得了進展班眯,可以生成與基因組類型相輔相成的數(shù)據(jù)類型希停。對于腫瘤免疫基因組學(xué)中大多數(shù)問題,可以應(yīng)用與癌癥基因組學(xué)中相同的NGS技術(shù)署隘,它們包括全外顯子組測序(WES)宠能,全基因組測序(WGS),RNA-seq磁餐,用于DNA甲基化分析的亞硫酸氫鹽測序和單細胞測序违崇。 然而,對于特定應(yīng)用诊霹,例如TCR測序羞延,需要仔細考慮讀取長度,測序數(shù)據(jù)(WES脾还,WGS或RNA-seq)的深度和類型伴箩。
在癌癥免疫學(xué)的背景下對組學(xué)數(shù)據(jù)的分析可以被視為兩步程序(圖2)。在對原始數(shù)據(jù)進行預(yù)處理之后荠呐,第一步是組學(xué)數(shù)據(jù)分析赛蔫,主要關(guān)注腫瘤本身。該步驟包括用于鑒定SNP泥张,小的插入和缺失呵恢,拷貝數(shù)變異(CNV),結(jié)構(gòu)變異媚创,基因融合以及變體注釋的工具渗钉。基因組分析組中的另一組工具用于分析使用RNA-seq評估的基因的表達钞钙,從WES和/或SNP陣列數(shù)據(jù)估計腫瘤異質(zhì)性或分析DNA甲基化模式鳄橘。第二類分析使用免疫基因工具,更關(guān)注腫瘤-免疫細胞相互作用芒炼。作為輸入數(shù)據(jù)瘫怜,它們使用基因組分析和/或原始測序數(shù)據(jù)的輸出。這些免疫基因組學(xué)分析的結(jié)果提供了有關(guān)腫瘤微環(huán)境的兩個關(guān)鍵特征的信息:浸潤的免疫細胞的組成和功能定向以及腫瘤抗原的來源和數(shù)量本刽。
使用基因組數(shù)據(jù)確定腫瘤浸潤的細胞組成
由于不同類型的TIL對腫瘤進展有不同的影響鲸湃,確定腫瘤中免疫浸潤的細胞組成不僅提供了預(yù)后信息赠涮,而且還可以促進標志物預(yù)測和新治療策略的發(fā)展。成像和細胞表型技術(shù)被廣泛使用暗挑,可以提供有關(guān)免疫結(jié)構(gòu)的部分信息笋除,但細胞表型分析技術(shù)的固有局限性阻礙了大量TIL亞群的特征化。因此炸裆,研究人員開發(fā)了計算基因組工具以提供TIL的全面圖像垃它。應(yīng)用于此目的的計算基因組學(xué)工具可以分組為基因集富集分析(GSEA)和去卷積方法(圖3a)。值得注意的是烹看,GSEA和反卷積方法都依賴于個體細胞群的表達譜矩陣国拇。用這些方法重建的TIL亞群包括在表達譜的參考矩陣中定義的免疫亞群。
富集方法依賴于基因集分析技術(shù)惯殊,基于樣本之間的比較或單樣本方法贝奇。 GSEA評估排序基因列表,用于統(tǒng)計富集參與某種途徑和細胞過程的基因靠胜。在比較方法中,基于兩種生物狀態(tài)之間的差異表達對基因進行排序毕源±四或者,可以使用單樣本GSEA(ssGSEA)富集評分霎褐,表示特定基因組中的哪些基因在單個樣品中上調(diào)或下調(diào)了址愿。 GSEA可用于解釋從微陣列或RNA-seq獲得的基因表達數(shù)據(jù)。
GSEA的優(yōu)勢在于它可以使用現(xiàn)有工具輕松應(yīng)用冻璃,與傳統(tǒng)的基因表達分析相比响谓,沒有額外的樣本量要求。GSEA的必要要求是與特定免疫亞群相關(guān)的基因標記的組裝(圖3b)省艳。在一項開創(chuàng)性研究中娘纷,從免疫和非免疫細胞的全血微陣列表達數(shù)據(jù)中定義了一組免疫特征基因34。最近跋炕,來自人免疫學(xué)項目的免疫學(xué)特征的基因集合(ImmuneSigDB)35被收錄到分子特征數(shù)據(jù)庫(MSigDB)36中赖晶。通過分析389項關(guān)于小鼠和人體免疫系統(tǒng)中細胞狀態(tài)和擾動的已發(fā)表研究,產(chǎn)生了約5,000個注釋良好的基因的補充35辐烂。
解卷積方法使用表達特征矩陣從來自細胞混合物的表達數(shù)據(jù)推斷特定細胞比例(圖3c)遏插。基于該算法纠修,開發(fā)了一種使用二次規(guī)劃進行異質(zhì)組織去卷積的R包.37胳嘲。這個名為DeconRNASeq的軟件包可以處理RNA-seq數(shù)據(jù),但它僅在少數(shù)細胞類型的混合物上得到驗證扣草。已經(jīng)開發(fā)了幾種其他方法了牛,其使用各種技術(shù)來解決病態(tài)反問題(表1)颜屠。最近,一種用于從大塊腫瘤的微陣列數(shù)據(jù)推斷白細胞亞型的計算方法(稱為CIBERSORT)被引入38白魂。 CIBERSORT使用22個白細胞亞群的信號表達矩陣并實現(xiàn)線性支持向量回歸38汽纤。盡管計算方法有各種成功的應(yīng)用,但仍有幾個問題需要改進30福荸。首先蕴坪,需要具有基因表達譜的參考矩陣,所述基因表達譜來自血液樣品或優(yōu)選來自使用RNA-seq的腫瘤樣品的分選的免疫細胞亞群敬锐。其次背传,由于解卷積對噪聲敏感,因此必須開發(fā)和實現(xiàn)魯棒算法台夺。第三径玖,需要使用獨立方法驗證方法,例如熒光激活細胞分選(FACS)或免疫組織化學(xué)颤介。
與基于基因表達譜的去卷積方法一樣梳星,細胞譜系特異性DNA甲基化模式可用于檢測和量化白細胞亞群39。為此目的滚朵,使用微陣列平臺(即冤灾,Illumina Infinium 27k和450k DNA甲基化陣列),使用來自少數(shù)甲基化CpG基因座的信息到全基因組基因座開發(fā)了許多方法和工具39-41辕近。將這種方法應(yīng)用于亞硫酸氫鹽測序技術(shù)的數(shù)據(jù)非常簡單韵吨。從表觀基因組關(guān)聯(lián)研究中可以明顯看出,表觀基因組在不同細胞類型中的變異很大42移宅。
腫瘤抗原的鑒定
T細胞能夠識別與腫瘤細胞的MHC分子結(jié)合的腫瘤特異性抗原而排斥腫瘤归粉。具有高腫瘤特異性的抗原 - 即由腫瘤細胞展示而不是由正常細胞展示 - 具有引發(fā)腫瘤特異性免疫應(yīng)答的潛力,從而將不良副作用的風(fēng)險降至最低漏峰,因此對于諸如工程化T細胞和治療性疫苗的癌癥免疫療法具有重要意義糠悼。
三類抗原具有高腫瘤特異性:首先是病毒抗原,其源自在病毒感染的腫瘤細胞中表達的病毒基因芽狗;第二種是癌癥種系抗原(CGAs)绢掰,是通常僅由滋養(yǎng)細胞和種系細胞表達但在腫瘤細胞中具有異常表達的蛋白質(zhì);第三種是新抗原,它們是由體細胞突變基因的表達產(chǎn)生的肽鏈童擎。自從發(fā)現(xiàn)第一個CGA滴劲,黑色素瘤抗原1(MAGE1;也稱為MAGEA1)被鑒定以來,已經(jīng)在幾種腫瘤類型中鑒定到表達的大量癌癥種系基因顾复。迄今為止班挖,Cancer-Testis數(shù)據(jù)庫包含了有關(guān)CGA,和其在腫瘤和正常組織中的表達以及誘導(dǎo)的免疫應(yīng)答的信息芯砸。利用可用的CGA列表萧芙,可直接在腫瘤和正常樣品的RNA-seq數(shù)據(jù)中提取它們的表達水平给梅。
新抗原可被認為具有嚴格的腫瘤特異性,因為它們源于惡性細胞中的突變基因的表達双揪,但不存在于正扯穑基因組中。為了引發(fā)免疫應(yīng)答渔期,必須將突變的蛋白質(zhì)蛋白水解加工成短肽运吓,然后與MHC分子結(jié)合,以呈遞給T細胞(圖4)疯趟。當從匹配的腫瘤和正常樣品中獲得NGS數(shù)據(jù)時拘哨,可以通過整合三個計算任務(wù)來計算新抗原(圖4):從匹配的腫瘤-正常樣品中鑒定突變蛋白,然后進行HLA分型和然后預(yù)測新抗原-MHC的結(jié)合親和力信峻。
組裝分析管道
在組裝癌癥免疫基因組學(xué)的計算流程時倦青,必須特別注意評估數(shù)據(jù)是否允許提取無偏見和有意義的信息。例如盹舞,閱讀長度和覆蓋深度對來自測序數(shù)據(jù)的免疫庫和HLA等位基因的分析具有強烈影響产镐。此外,還必須考慮用于生成數(shù)據(jù)的測序平臺踢步,以確定所選工具是否能夠區(qū)分平臺特異性測序錯誤與真實變體磷账。另一個需要考慮的問題是批次效應(yīng),它是由不同實驗條件引起的變異的技術(shù)來源贾虽。 可以使用降維工具(例如主成分分析)識別這些假象,并隨后使用替代變量分析進行校正吼鱼。
直到最近蓬豁,才報道了整合多個分析步驟的新抗原預(yù)測的計算解決方案(表1)。除NetTepi90外菇肃,目前還有其他解決方案地粪,例如:NetCTLpan110,這是一種用于預(yù)測蛋白質(zhì)分裂琐谤,TAP轉(zhuǎn)運和pMHC結(jié)合的泛特異性方法; EpiToolkit111蟆技,是一個基于Web的平臺,用于靈活整合預(yù)先選擇的計算模塊斗忌,用于表位預(yù)測和優(yōu)先級排序; FRED 2(REF.112)质礼,它是HLA分型,表位預(yù)測和選擇的網(wǎng)絡(luò)資源织阳,也允許定制管道的原型設(shè)計;和pVAC-Seq113眶蕉,它是一種新的抗原鑒定管道,可以考慮突變覆蓋率唧躲,變異等位基因頻率和突變基因的表達造挽。隨著云計算解決方案可用性的增加碱璃,我們預(yù)計在不久的將來,將開發(fā)利用這種計算基礎(chǔ)設(shè)施的癌癥免疫基因組學(xué)分析管道饭入。