【CIBERSORT】超詳細(xì)替蛉,從數(shù)據(jù)下載到數(shù)據(jù)分析全過程(初學(xué)者筆記)
cibersort是目前引用次數(shù)最多的免疫細(xì)胞浸潤估計(jì)分析工具,2015年首次發(fā)表于nature method拄氯。
【腫瘤免疫細(xì)胞浸潤】
腫瘤免疫細(xì)胞浸潤是指免疫細(xì)胞從血液中移向腫瘤組織躲查,開始發(fā)揮它的作用,可以從腫瘤組織中分離出的浸潤免疫細(xì)胞译柏。
腫瘤中免疫細(xì)胞的浸潤與臨床結(jié)果密切相關(guān)镣煮,腫瘤中浸潤的免疫細(xì)胞最有可能作為藥物靶標(biāo)來提高患者的生存率。
【數(shù)據(jù)處理】
step1:數(shù)據(jù)下載
示例數(shù)據(jù):GSE11103(與官網(wǎng)示例中數(shù)據(jù)一致)
在GEO上下載series matrix file和GSE11103_RAW.tar
查詢平臺信息鄙麦,得知GSE11103使用的平臺是GPL570
點(diǎn)進(jìn)去之后拉到最下面點(diǎn)擊download full table典唇,下載平臺信息
step2:原始數(shù)據(jù)處理
查看GSE11103_series_matrix(來自Series Matrix File),手動挑選出Sample_title和Sample_geo_accession, 即樣本的名字和對應(yīng)的id胯府,后續(xù)處理數(shù)據(jù)的列名需要用到介衔。文件命名為GSE11103_series_process.txt。
注:在講后續(xù)數(shù)據(jù)處理之前盟劫,我想先講一下我文件的放置順序夜牡。data里的數(shù)據(jù)就是之前下載的和自己手動處理的數(shù)據(jù)与纽。program里的是會用到的程序和一些由于運(yùn)行程序必須存在的文件
step3:提取表達(dá)值
#data_processing.R
用mas5方法對數(shù)據(jù)進(jìn)行背景矯正,mas5方法處理的數(shù)據(jù)未經(jīng)log轉(zhuǎn)換侣签。cibersort需要的數(shù)據(jù)正是未經(jīng)log轉(zhuǎn)換的塘装。
【數(shù)據(jù)分析】
最近官網(wǎng)不知道什么原因,并不能上傳數(shù)據(jù)影所,我在簡書上看到一個作者寫了一個R的腳本蹦肴,把cibersort封裝成一個R的函數(shù),可以運(yùn)行猴娩,和大家分享一下阴幌。作者的源代碼就是program里的cibersort_ann.R。
[R]用R執(zhí)行cibersort卷中,根據(jù)組織的基因表達(dá)譜獲取細(xì)胞的百分比 - 簡書
鏈接放在這里矛双,源代碼我就不放啦,大家自己去這個網(wǎng)頁上copy吧~
program里的LM22也是這個作者提供噠~
接下來我就用這個函數(shù)運(yùn)行一下生成的文件
這個函數(shù)只能成功運(yùn)行行名為基因名的文件蟆豫,行名為探針名的文件不能運(yùn)行成功议忽。但是官網(wǎng)上的示例文件的行名是探針名,由于官網(wǎng)目前并不能上傳數(shù)據(jù)十减,所以我也不清楚到底可不可行栈幸。
以上是我對cibersort的初學(xué)筆記,僅供參考~