腫瘤不是單純的惡性細胞群,而是由不同類型細胞組成的復(fù)雜生態(tài)系統(tǒng)斜棚。在這些細胞中阀蒂,腫瘤浸潤免疫細胞在腫瘤控制和治療反應(yīng)中起著核心作用。例如弟蚀,細胞毒性CD8 + T細胞是抗癌免疫的主要效應(yīng)因子蚤霞,因為它們可以特異性地識別和殺死攜帶新抗原的腫瘤細胞。腫瘤特異性抗原主要來源于突變基因的表達义钉。但免疫細胞也可以發(fā)揮免疫抑制作用昧绣,支持腫瘤發(fā)生和免疫逃避,如調(diào)節(jié)性T細胞捶闸。因此夜畴,對不同類型的腫瘤浸潤免疫細胞進行定量研究,有助于闡明腫瘤免疫應(yīng)答的機制删壮、評價腫瘤治療的免疫原性作用贪绘,最終指導設(shè)計合理治療方案。背景介紹最著名的標記基因分析方法是基因集富集分析(GSEA)央碟∷肮啵基于GSEA的方法計算富集分數(shù)(ES),當某一細胞類型的特異性基因在感興趣的樣本中處于高表達的前幾位亿虽,而在其他情況下則處于低表達的前幾位時菱涤,該分數(shù)較高。
基于GSEA的方法只能計算樣本中細胞類型富集的半定量分數(shù)经柴,而反褶積方法可以定量地估計感興趣的細胞類型的相對分數(shù)狸窘。反褶積算法將異種樣本的基因表達譜看作是不同細胞的基因表達水平的卷積墩朦,并利用描述細胞類型特異性表達譜的特征矩陣來估計未知的細胞組分坯认。
下面是利用標記基因與GSEA或其他評分方法,或利用反褶積算法和免疫細胞表達特征氓涣,從細胞混合物的表達數(shù)據(jù)量化免疫細胞的計算方法牛哺。
下圖是幾個從轉(zhuǎn)錄組學數(shù)據(jù)定量腫瘤浸潤免疫細胞的計算工具:
M = marker genes, P = partial deconvolution, C = complete deconvolution方法簡介****01基于標記基因的評分方法(1)MCPcounter
一種基于標記基因定量腫瘤浸潤免疫細胞(CD3 + T細胞,CD8 + T細胞劳吠,細胞毒性淋巴細胞引润,NK細胞,B淋巴細胞痒玩,單核細胞來源的細胞(單核細胞系)淳附,髓樣樹突狀細胞议慰,中性粒細胞)、成纖維細胞和上皮細胞的方法奴曙。對于每個細胞類型和樣本别凹,豐度得分為細胞類型特異性基因表達值的幾何平均值,獨立地對每個樣本進行計算的洽糟。由于分數(shù)是用任意單位表示的炉菲,它們不能直接解釋為細胞分數(shù),也不能在細胞類型之間進行比較坤溃。進行定量驗證時拍霜,估計分數(shù)與真實細胞分數(shù)之間具有很高的相關(guān)性,證明了MCP-counter用于樣本間比較的價值薪介。MCP-counter已應(yīng)用于對32個非血液學腫瘤的19,000多個樣本中的免疫細胞和非免疫細胞進行量化祠饺。
(2)TIminer
TIminer是一個用戶友好的計算框架,用于不同的腫瘤免疫基因組分析昭灵,包括(i)來自NGS數(shù)據(jù)的人白細胞抗原HLAs基因分型吠裆;(ii)使用突變數(shù)據(jù)和HLA類型預(yù)測腫瘤新抗原;(iii)來自大量RNA-seq數(shù)據(jù)來分析定量腫瘤浸潤免疫細胞烂完;(iv)通過表達數(shù)據(jù)量化腫瘤的免疫原性试疙。
(3)xCell
xCell是一種基于ssGSEA的方法,能夠計算64種免疫細胞的豐度分數(shù)抠蚣,包括適應(yīng)性和先天免疫細胞祝旷、造血祖細胞、上皮細胞和細胞外基質(zhì)細胞嘶窄』初耍基于FANTOM5,ENCODE柄冲,Blueprint吻谋,Immune Response In Silico (IRIS),Human Primary Cell Atlas (HPCA)和Novershtern等6個研究的489個基因集现横。對于每種細胞類型漓拾,計算xCell豐度分數(shù)的主要步驟有四個:(i)利用R包GSVA對489個基因集單獨進行ssGSEA;(ii)對屬于一種細胞類型的所有基因集的ES進行平均戒祠;(iii)平臺特異性ES轉(zhuǎn)化為豐度分數(shù)骇两;(iv)使用與流式細胞術(shù)數(shù)據(jù)分析類似的spillover方法糾正密切相關(guān)的細胞類型之間的關(guān)系。
02使用表達特征對細胞混合物進行反褶積(1)DeconRNASeq
Gong和Szustakowski將約束回歸模型應(yīng)用于RNA-seq數(shù)據(jù)分析姜盈,并將其實現(xiàn)在R包DeconRNASeq中低千。混合五種人體組織(大腦馏颂、骨骼肌示血、肺棋傍、肝和心臟)的RNA-seq數(shù)據(jù),通過合并組織類型特異性基因來估計組織或細胞類型的比例难审。并利用Illumina’s human Body Map 2.0中RNA-seq數(shù)據(jù)構(gòu)建的特征矩陣舍沙,對算法進行了仿真驗證。雖然還沒有開發(fā)出新的免疫特征剔宪,但該工具原則上可以應(yīng)用于任何特征矩陣拂铡。
(2)CIBERSORT
CIBERSORT算法利用微陣列數(shù)據(jù)構(gòu)建特征矩陣,描述22種免疫細胞表型的表達特征葱绒,包括不同的細胞類型和功能狀態(tài)的免疫細胞感帅。CIBERSORT使用ν-SVR評估細胞分數(shù)。CIBERSORT分別在9個免疫細胞亞群和3個免疫細胞亞群的同時反褶積方面具有較高的準確性地淀,在4種惡性免疫細胞的模擬混合物上測試失球,也證明了對不同程度的噪音和未知的腫瘤具有魯棒性。
(3)TIMER
一個系統(tǒng)評估不同的免疫細胞對不同癌癥類型的臨床影響的資源帮毁。利用一系列免疫特異性標記和免疫細胞表達特征实苞,來估計32種癌癥類型中6種免疫細胞類型(B細胞、CD4 T細胞烈疚、CD8 T細胞黔牵、中性粒細胞、巨噬細胞和樹突狀細胞)的豐度爷肝。從RNA-seq或微陣列數(shù)據(jù)中提取的癌癥表達矩陣與免疫細胞表達矩陣合并猾浦,并用Combat進行歸一化,以消除批量效應(yīng)灯抛。通過從免疫細胞標記中選擇與腫瘤純度負相關(guān)的基因金赦,為每種癌癥類型分別識別特征基因。最后对嚼,對于每種癌癥類型夹抗,考慮到所選的免疫細胞標記,從標準化的免疫細胞配置文件構(gòu)建特征矩陣纵竖。TIMER使用線性最小二乘回歸方法執(zhí)行反褶積漠烧,并強制所有負估計為零。用越來越小的一組T細胞標記重復(fù)估計幾次磨确,以減少CD8 +和CD4 + T細胞比例之間的相關(guān)性沽甥。與CIBERSORT不同的是声邦,最終的估計并沒有被規(guī)范化乏奥,因此不能直接解釋為細胞組分,也不能在不同的免疫細胞類型和數(shù)據(jù)集之間進行比較亥曹。
(4)EPIC
Estimate the Proportion of Immune and Cancer cells (EPIC)邓了,用來估計免疫細胞和癌細胞比例恨诱。EPIC使用約束最小二乘回歸明確地將非負性約束引入反褶積問題,并要求每個樣本中所有細胞組分的總和不超過一個骗炉。EPIC克服了以往從大量腫瘤基因表達數(shù)據(jù)預(yù)測癌癥和免疫細胞或其他非惡性細胞類型的方法的幾個局限性照宝,考慮了非特征性和可能高度可變的細胞類型,并在算法上得到了發(fā)展句葵。能夠廣泛應(yīng)用于大多數(shù)實體腫瘤厕鹃,如黑色素瘤和結(jié)直腸樣本驗證的情況,但不適合血液惡性腫瘤乍丈,如白血病或淋巴瘤剂碴。
(5)quanTIseq
quanTIseq是專門為RNA-seq數(shù)據(jù)開發(fā)的反褶積工具,能夠準確定量未知腫瘤的含量轻专,以及量化整體組織的免疫細胞組份忆矛。基于約束最小二乘回歸和一個新的特征矩陣(來自51個純化或富集的免疫細胞類型的RNA-seq數(shù)據(jù)集)请垛。quanTIseq實現(xiàn)了一個完整的反褶積流程來分析RNA-seq數(shù)據(jù)催训,能夠避免混合物和特征矩陣之間的不一致性。
03細胞組分和表達譜的同時反褶積(1)DSA
數(shù)字排序算法Digital Sorting Algorithm—DSA是一個完整的反褶積算法宗收,它基于一組從混合組織樣本中提取在特定細胞類型中高度表達的標記基因漫拭,利用二次規(guī)劃來推斷復(fù)雜組織中的細胞組分和表達譜。該算法在三種惡性免疫細胞系混合的微陣列數(shù)據(jù)上進行了測試混稽,重建了真實的細胞組分和表達譜嫂侍。該算法是無偏的,不需要細胞類型頻率的先驗知識荚坞。
小編總結(jié)今天我們簡單介紹了一些關(guān)于免疫浸潤的方法挑宠,之后會有更多詳細的壓箱底使用方法分享,不要錯過呀颓影。REF:Finotello, F., & Trajanoski, Z. (2018). Quantifying tumor-infiltrating immune cells from transcriptomics data. Cancer immunology, immunotherapy : CII, 67(7), 1031–1040. https://doi.org/10.1007/s00262-018-2150-z