這個(gè)包發(fā)表于2021年,以患者的RNA序列數(shù)據(jù)作為輸入财饥,來預(yù)測(cè)免疫治療的結(jié)果落竹。文章的DOI是:doi: 10.1016/j.patter.2021.100293.
用戶手冊(cè)在:http://127.0.0.1:27097/library/easier/doc/easier_user_manual.html
輸入的表達(dá)矩陣要求是RNA-Seq數(shù)據(jù),原始的Counts數(shù)據(jù)和TPM數(shù)據(jù)都可以剪况。
easier包主要包括以下幾個(gè)功能:
一教沾、計(jì)算免疫反應(yīng)的特征(Compute hallmarks of immune response)
compute_scores_immune_response函數(shù)能夠?qū)Χ鄠€(gè)不同的免疫特征進(jìn)行打分,主要包括:
函數(shù)里的selected_scores參數(shù)可以選擇輸出哪些Hallmarks译断。比如我們指定2個(gè)Hallmarks進(jìn)行計(jì)算:
> immune_response_scores <- compute_scores_immune_response(RNA_tpm = tpm)
結(jié)果是一個(gè)dataframe授翻,行是樣本,列是分?jǐn)?shù)孙咪。
> head(immune_response_scores)
CYT TLS IFNy Ayers_expIS
TCGA-05-4244-01A 6.804592 8.771665 5.044553 4.562678
TCGA-05-4250-01A 43.445152 8.315098 7.135774 6.035539
TCGA-05-4382-01A 11.721161 19.004632 6.411094 5.380301
TCGA-05-4384-01A 10.612710 17.434152 4.950731 4.482248
TCGA-05-4389-01A 35.632111 16.462322 7.097995 6.227765
TCGA-05-4390-01A 4.065595 4.934187 4.510498 3.948847
二堪唐、對(duì)TME定量描述的計(jì)算
這里主要是為后面計(jì)算免疫治療響應(yīng)準(zhǔn)備數(shù)據(jù),分以下幾個(gè)部分该贾。
(一)細(xì)胞成分
比CIBERSORT簡(jiǎn)單一些羔杨,不需要讀入LM22的文件,但是相應(yīng)的只有9個(gè)類別杨蛋。
> str(cell_fractions)
'data.frame': 486 obs. of 11 variables:
$ B : num 0.00607 0.01211 0.02209 0.00391 0.01051 ...
$ M1 : num 0.2832 0.1664 0.1915 0.1058 0.0712 ...
$ M2 : num 0.0561 0.037 0.0834 0.1553 0.0607 ...
$ Monocyte : num 0 0 0 0 0 ...
$ Neutrophil: num 0.0543 0.0468 0.0118 0.033 0.1042 ...
$ NK : num 0.00814 0 0.00452 0.00526 0.002 ...
$ CD4 T : num 0.0436 0.0595 0.0353 0.0356 0.0369 ...
$ CD8+ T : num 0.00919 0.03629 0.00194 0.00504 0.03537 ...
$ Treg : num 0.0436 0.0221 0.0353 0.0229 0.0369 ...
$ DC : num 0 0 0 0 0 ...
$ Other : num 0.539 0.642 0.649 0.656 0.679 ...
(二)通路活性方面
主要是評(píng)估14條信號(hào)通路的活性兜材,包括Androgen、EGFR逞力、Estrogen曙寡、Hypoxia、JAK-STAT寇荧、MAPK举庶、NFkB、p53揩抡、PI3K户侥、TGFb、TNFa峦嗤、Trail蕊唐、VEGF、WNT的活性烁设。注意這一步只能輸入Counts替梨。
> pathway_activities <- compute_pathway_activity(RNA_counts = , remove_sig_genes_immune_response = TRUE)
> str(pathway_activities)
'data.frame': 486 obs. of 14 variables:
$ Androgen: num 3765 3789 3613 3869 3695 ...
$ EGFR : num 53.65 210.41 9.37 -82.37 -20.52 ...
$ Estrogen: num 2399 2439 2357 2425 2333 ...
$ Hypoxia : num 7787 7853 8095 7170 7132 ...
$ JAK-STAT: num 6883 7086 6912 6595 7129 ...
$ MAPK : num 1441 1662 1357 1294 1313 ...
$ NFkB : num 6823 6829 7326 6383 6561 ...
$ p53 : num 4677 4646 4592 4871 4845 ...
$ PI3K : num -3602 -3513 -3465 -3635 -3571 ...
$ TGFb : num 3038 3224 3419 3096 2969 ...
$ TNFa : num 7198 7124 7564 6556 6708 ...
$ Trail : num 118 120 135 100 142 ...
$ VEGF : num -417 -508 -503 -564 -488 ...
$ WNT : num 630 647 698 656 697 ...
(三)轉(zhuǎn)錄因子活性
能夠?qū)?18個(gè)轉(zhuǎn)錄因子的活性進(jìn)行評(píng)估
> tf_activities <- compute_TF_activity(RNA_tpm = tpm)
> str(tf_activities)
'data.frame': 486 obs. of 118 variables:
$ AR : num -0.709 1.233 -2.683 -1.041 -1.452 ...
$ ARNTL : num 2.389 0.821 1.489 -0.25 0.22 ...
$ ATF1 : num 1.191 2.22 1.093 -0.459 0.268 ...
$ ATF2 : num 0.201 2.197 0.425 0.823 -0.4 ...
$ ATF4 : num 0.727 1.965 0.259 -0.992 -0.409 ...
$ ATF6 : num 0.825 0.341 2.062 0.326 1.216 ...
$ BACH1 : num 1.216 0.497 0.338 1.645 2.544 ...
$ CDX2 : num -1.3392 -0.5584 -0.8671 -0.8286 0.0699 ...
$ CEBPA : num 1.775 2.059 1.663 0.097 1.424 ...
$ CEBPB : num 1.084 0.993 0.781 0.482 1.155 ...
$ CEBPD : num 0.4532 -0.0117 0.3975 0.5953 0.5444 ...
表格很長(zhǎng),這里就不全部展示了。
(四)配體-受體權(quán)重與細(xì)胞間相互作用
手冊(cè)的描述:使用衍生的癌癥特異性細(xì)胞間網(wǎng)絡(luò)副瀑,可以對(duì)867個(gè)配體-受體的權(quán)重進(jìn)行量化弓熏。使用配體-受體權(quán)重作為輸入,可以得出169個(gè)細(xì)胞-細(xì)胞相互作用分?jǐn)?shù)糠睡。結(jié)果跟上面的類似挽鞠,這里也不展示了。
總結(jié)一下狈孔,這一步我們獲得了cell_fractions滞谢、pathway_activities、tf_activities除抛、lrpair_weights、ccpair_scores一共5個(gè)變量母截,接下來這5個(gè)變量要全部(或部分)輸入到一個(gè)函數(shù)里來預(yù)測(cè)免疫治療的響應(yīng)到忽。
三、獲取患者對(duì)免疫反應(yīng)的預(yù)測(cè)
> predictions <- predict_immune_response(pathways = pathway_activities,
immunecells = cell_fractions,
tfs = tf_activities,
lrpairs = lrpair_weights,
ccpairs = ccpair_scores,
cancer_type = cancer_type,
verbose = TRUE)
這個(gè)函數(shù)的輸入包括5個(gè)內(nèi)容清寇,都是上面計(jì)算得出來的結(jié)果喘漏。另外還需要指定癌種,主要包括:膀胱尿路上皮癌(BLCA)华烟、BRCA浸潤(rùn)癌(BRCA)翩迈、宮頸癌和宮頸癌(CESC)、結(jié)直腸癌(CRC)盔夜、多形性膠質(zhì)母細(xì)胞瘤(GBM)负饲、頭頸部鱗狀細(xì)胞癌(HNSC)、腎透明細(xì)胞癌(KIRC)喂链、腎腎乳頭狀細(xì)胞癌(KIRP)返十、肝細(xì)胞癌(LIHC)、肺腺癌(LUAD)椭微,肺鱗狀細(xì)胞癌(LUSC)洞坑、非小細(xì)胞肺癌(NSCLC[LUAD+LUSC])、卵巢漿液性囊腺癌(OV)蝇率、胰腺癌(PAAD)迟杂、前列腺癌(PRAD)、皮膚黑色素瘤(SKCM)本慕、胃腺癌(STAD)排拷、甲狀腺癌(THCA)、子宮內(nèi)膜體癌(UCEC)间狂。
這一步得到的結(jié)果predictions是一個(gè)list攻泼,需要進(jìn)一步處理才能得到最終的預(yù)測(cè)結(jié)果。
四、得到ICB治療的預(yù)測(cè)結(jié)果
通過函數(shù)retrieve_easier_score可以對(duì)上面的list進(jìn)行處理得到easier預(yù)測(cè)的免疫治療響應(yīng)評(píng)分忙菠。如果有TMB信息還可以聯(lián)合TMB信息進(jìn)行評(píng)估何鸡。
> easier_derived_scores <- retrieve_easier_score(predictions_immune_response = predictions,
TMB_values = TMB,
easier_with_TMB = c("weighted_average",
"penalized_score"),
weight_penalty = 0.5)
得到的結(jié)果是一個(gè)dataframe,里面存著不同方法得到的免疫治療響應(yīng)的評(píng)分牛欢。其中easier_score是不納入TMB信息的得分骡男。
> str(easier_derived_scores)
'data.frame': 482 obs. of 3 variables:
$ easier_score: num -0.356 0.135 0.162 -0.552 0.348 ...
$ w_avg_score : num 0.229 0.268 0.395 0.213 0.285 ...
$ pen_score : num -0.356 0.135 0.662 -0.552 0.348 ...
這里TMB有兩種納入的方法,一種是加權(quán)傍睹,一種是懲罰得分隔盛,可以兩個(gè)都算出來看看。另外拾稳,輸入的TMB必須為一個(gè)Named_num吮炕。否則會(huì)報(bào)錯(cuò)。
除了上面這個(gè)函數(shù)访得,還可以通過函數(shù)assess_immune_response進(jìn)行處理龙亲。
> output_eval_with_resp <- assess_immune_response(predictions_immune_response = predictions,
patient_response = patient_ICBresponse,
RNA_tpm = RNA_tpm,
TMB_values = TMB,
easier_with_TMB = "weighted_average",
weight_penalty = 0.5)
這個(gè)函數(shù)的參數(shù)patient_response是由用戶提供的每個(gè)患者的治療信息,整理成兩個(gè)因子的字符向量輸入(Non-responders = NR, Responders = R)悍抑,如果沒有治療信息的話可以直接把這個(gè)參數(shù)刪掉鳄炉。
這個(gè)函數(shù)會(huì)輸出一個(gè)list,里面存著幾個(gè)圖搜骡。
如果提供了patient_response的話拂盯,會(huì)輸出一個(gè)ROC曲線和一個(gè)AUC的barplot。
如果同時(shí)還提供了TMB的話记靡,將返回一個(gè)散點(diǎn)圖谈竿,顯示綜合方法、easier score和TMB的AUC值摸吠。
如果沒有patient_response的話榕订,將返回一個(gè)點(diǎn)圖,代表每個(gè)患者的綜合得分蜕便,同時(shí)還有一個(gè)箱線圖劫恒。
以上是個(gè)人摸索的一些經(jīng)驗(yàn),不當(dāng)之處請(qǐng)大家多多批評(píng)指正轿腺!