前言
還記得Immugent最開始做數(shù)據(jù)挖掘時,最常做的分析之一就是用ESTIMATE包來評估腫瘤組織的免疫浸潤情況携栋,雖然得到的結(jié)果只有stromal score搭盾,immune score,estimate score和pirity score四個值婉支,但是其準(zhǔn)確性是相當(dāng)高的鸯隅!當(dāng)然后面出現(xiàn)了很多新型的反卷積軟件,細(xì)胞類型頁越來越細(xì)化向挖,但是ESTIMATE包依然頻繁出現(xiàn)在最新發(fā)表的各類文章中蝌以。
ESTIMATE包是從表達(dá)數(shù)據(jù)推斷腫瘤純度的基礎(chǔ),但缺乏相關(guān)介紹文檔户誓,而且有時它的功能在做得不夠的情況下越界饼灿。tidyestimate包是ESTIMATE的更新,目的是在維護(hù)這個包的優(yōu)秀功能時帝美,增加它的文檔和功能范圍。
下面Immugent就來介紹一下tidyestimate包晤硕。悼潭。。
代碼流程
首先回顧一下優(yōu)秀的ESTIMATE包舞箍,它最初的文章在2013年發(fā)表在NC上舰褪,起點還是挺高的。
這么優(yōu)秀的包疏橄,當(dāng)然引用率是非痴寂模客觀的略就,截止到目前已經(jīng)被4000+的文章引用過了。
install.packages("tidyestimate")
#or
devtools::install_github("KaiAragaki/tidy_estimate")
這次更新的特點主要包括以下內(nèi)容:
那么下面就開始探索一下這個新包吧晃酒!
library(tidyestimate)
dim(ov)
#> [1] 17256 10
head(ov)[,1:5]
#> s516 s518 s519 s520 s521
#> C9orf152 4.8815 4.5757 3.7395 3.6960 4.1597
#> ELMO2 7.2981 7.5554 7.5332 7.3824 7.3079
#> CREB3L1 5.5692 5.7004 5.9597 5.7700 5.2190
#> RPS11 13.3899 13.8488 13.6429 13.6546 13.5698
#> PNMA1 9.3480 10.0092 10.4310 9.5399 9.6423
#> MMP2 7.6182 8.0369 8.9551 10.3875 7.4141```
這個新包繼續(xù)延續(xù)之前之前簡便的特點表牢,運行起來也很簡便,一行代碼搞定贝次。
scores <- ov |>
filter_common_genes(id = "hgnc_symbol", tell_missing = FALSE, find_alias = TRUE) |>
estimate_score(is_affymetrix = TRUE)
> 461 of 488 missing genes found matches using aliases.
>
> Found 10364 of 10391 genes (99.74%) in your dataset.
> Number of stromal_signature genes in data: 141 (out of 141)
> Number of immune_signature genes in data: 141 (out of 141)
scores
> sample stromal immune estimate purity
> 1 s516 -285.49841 165.75062 -119.7478 0.8323791
> 2 s518 -429.16931 99.71302 -329.4563 0.8490421
> 3 s519 -60.98619 -368.70314 -429.6893 0.8567232
> 4 s520 1927.51431 2326.15984 4253.6742 0.3348246
> 5 s521 -673.84954 141.72775 -532.1218 0.8643812
> 6 s522 1447.95517 1166.51854 2614.4737 0.5497248
> 7 s523 -271.15756 -928.44921 -1199.6068 0.9094242
> 8 s525 965.61804 1310.27775 2275.8958 0.5905450
> 9 s526 545.99467 2149.10473 2695.0994 0.5398002
> 10 s527 -710.44370 1303.08009 592.6364 0.7699846
They can also be plotted in context of the Affymetrix profiled tumors used to generate the ESTIMATE model:
scores |>
plot_purity(is_affymetrix = TRUE)
A more detailed version of this example can be found in the vignette of this package.
* * *
## 說在最后
Immugent已經(jīng)對tidyestimate包做過一些簡單的測試崔兴,在沒有降低準(zhǔn)確性的同時,確實提速了不少蛔翅。但是有一說一敲茄,tidyestimate包其實還可以做一些別的方面的升級,比如增加數(shù)據(jù)的適用性山析,或者聯(lián)合其它分析流程堰燎,畢竟現(xiàn)在主打的就是一個集合與多功能。
好啦笋轨,本次介紹到這里就結(jié)束啦秆剪,我們下次再會~~