腫瘤微環(huán)境是近年來的研究熱點。復(fù)雜而動態(tài)的微環(huán)境中,腫瘤細(xì)胞與浸潤性免疫細(xì)胞击奶、基質(zhì)細(xì)胞等相互作用辈双,這在促進(jìn)或抑制腫瘤生長、侵襲柜砾、轉(zhuǎn)移以及對病人臨床預(yù)后方面可能具有多方面的影響湃望。很多算法與工具應(yīng)運而生。
而基于表達(dá)譜分析組織中細(xì)胞組分情況痰驱,主要分成兩大類:去卷積(deconvolving)方法分析細(xì)胞組成成分與評估每種細(xì)胞類型的富集情況证芭。今天介紹兩種比較典型的工具,分別是基于前者的CIBERSORT和基于后者的xCell担映,兩種工具都可以在網(wǎng)頁在線運行或利用R語言編程運行废士。
1. CIBERSORT
文章于2015年發(fā)表于Nature Methods,目前引用量已經(jīng)超過1200蝇完,可見熱度官硝。
算法本身的理解目前對于我來講有一定難度,總體是利用線性支持向量回歸(linear support vector regression)方法對腫瘤組織表達(dá)矩陣進(jìn)行反卷積短蜕,分析組織中各類型的細(xì)胞含量氢架。
文章給出了一個名為LM22的leukocyte gene signature matrix作為參考集,包含22種白細(xì)胞亞型朋魔,
It contains 547 genes that distinguish 22 human hematopoietic cell phenotypes, including seven T-cell types, na?ve and memory B cells, plasma cells, natural killer (NK) cells and myeloid subsets.
1.1 網(wǎng)頁版
http://cibersort.stanford.edu/是其在線工具的網(wǎng)址岖研,注冊后即可獲得500M的存儲空間,進(jìn)而使用警检。
首先點擊Menu下的Upload Files孙援,上傳我們需要進(jìn)行分析的表達(dá)矩陣,格式要求如下:
總結(jié)來說就是需要上傳制表符分隔的扇雕,每行為基因赃磨,每列為樣本的表達(dá)譜文件,基因名采用HUGO gene symbols洼裤,表達(dá)值不經(jīng)過log2處理邻辉,且不能有缺失值。
文件上傳成功后腮鞍,F(xiàn)ile Type選擇Mixture值骇,Title自行編寫,之后點擊Menu下的Run CIBERSORT移国,進(jìn)入下面頁面
第一個“絕對模式”和“相對模式”的選擇吱瘩,根據(jù)頁面所列的細(xì)節(jié),個人認(rèn)為暫不勾選較好
Signature gene file 選擇LM22(22 immune cell types) (另:工具也可以自行確定signature matrix迹缀,分析其他細(xì)胞類型情況使碾,我們先行跳過)
Mixture file 選擇我們之前upload好的文件
Permutations 選擇1000蜜徽,準(zhǔn)確性會更高,雖然運行時間變長
其余高級選項保留默認(rèn)票摇,點擊Run拘鞋,進(jìn)行分析,分析之后即可下載各種文件格式的結(jié)果矢门。結(jié)果示例如下圖:
1.2 R函數(shù)版
我們知道上述網(wǎng)頁工具已經(jīng)是相當(dāng)簡便的了盆色,那么我們再用R函數(shù)做CIBERSORT是不是就沒有意義呢,不是祟剔,最起碼網(wǎng)不好的時候不用著急隔躲。。物延。
R函數(shù)版非常簡單宣旱,只需要source一下封裝好的腳本,再把相關(guān)文件導(dǎo)入運算即可
source('CIBERSORT.R')
result <- CIBERSORT('LM22.txt','CIBERSORT_RNA.txt', perm = 1000, QN = TRUE)
腳本CIBERSORT.R在 https://rdrr.io/github/singha53/amritr/src/R/supportFunc_cibersort.R上可以找到叛薯,復(fù)制响鹃,粘貼,保存即可案训。
CIBERSORT()
有4個參數(shù)买置,第一個'LM22.txt'即參考集leukocyte gene signature matrix,可在https://cibersort.stanford.edu/download.php處下載强霎,第二個'CIBERSORT_RNA.txt'是我們準(zhǔn)備好的表達(dá)矩陣忿项,perm是計算p值時的置換次數(shù),我們設(shè)置為1000城舞,與網(wǎng)頁版保持一致轩触,QN是是否進(jìn)行分位數(shù)歸一化,默認(rèn)為TRUE家夺。運行后即可得到樣本各細(xì)胞組分含量的結(jié)果脱柱。
2. xCell
文章于2017年發(fā)表于Genome Biology,目前引用在230+拉馋,影響力并沒有CIBERSORT這么廣泛榨为。
算法包含了5個大類的64種細(xì)胞類型
2.1 網(wǎng)頁版
https://xcell.ucsf.edu/是其在線工具的網(wǎng)址,不需注冊
只需要上傳基因表達(dá)數(shù)據(jù)煌茴,填寫自己的郵箱地址随闺,Run。結(jié)果運行出來后蔓腐,會通過郵件的形式發(fā)至我們留的郵箱矩乐。注意填寫RNA-seq與否的選項框。
表達(dá)數(shù)據(jù)的格式要求:
2.2 R包版
R包xCell存放在Github上回论,https://github.com/dviraran/xCell
devtools::install_github('dviraran/xCell')
library(xCell)
xCell = xCellAnalysis(expr, rnaseq = TRUE) # RNA-seq
# xCell = xCellAnalysis(expr, rnaseq = FALSE) # 非RNA-seq
主要就是xCellAnalysis()
函數(shù)散罕,第一個參數(shù)是我們的表達(dá)矩陣對象分歇,同時注意rnaseq參數(shù)是或否的選擇。