單細胞之富集分析-6：PROGENy

單細胞富集分析系列：

0. 簡介

異常細胞信號會引起癌癥等其他疾病弹渔，并且是常見的治療的靶點牲平。撤沾停可以通過基因的表達來推斷某個信號通路的活性玫荣。然而糕伐，只考慮基因表達對通路的作用往往忽略了翻譯后修飾的作用险掀，并且下游信號代表非常特定的實驗條件徽职。在這里枝缔，作者提出介紹PROGENy，這是一種通過利用大量公開可用的擾動實驗熔吗，來克服了這兩個局限性的方法辆床。與現(xiàn)有方法不同，PROGENy可以（i）恢復(fù)已知驅(qū)動基因突變的作用桅狠，（ii）提供或改善藥物的marker讼载，以及（iii）區(qū)分致癌和腫瘤抑制途徑轿秧，以確保患者生存咨堤。

PROGENy可以從基因表達數(shù)據(jù)中推斷14種信號通路（雄激素菇篡，雌激素，EGFR吱型，低氧逸贾，JAK-STAT，MAPK津滞，NFkB，PI3K灼伤，p53触徐，TGFb，TNFa狐赡，Trail撞鹉，VEGF和WNT）的通路活性。默認情況下颖侄，途徑活動推斷是基于相應(yīng)的途徑擾動后前100個響應(yīng)性最高的基因的基因集鸟雏，我們將其稱為途徑的足跡基因。為每個足跡基因分配一個權(quán)重览祖，該權(quán)重表示對路徑擾動進行調(diào)節(jié)的強度和方向孝鹊。途徑得分是通過表達和足跡基因權(quán)重乘積的加權(quán)總和計算得出的。
例如：在pbmc單細胞數(shù)據(jù)中識別通路活性展蒂。

1. 分析Bulk數(shù)據(jù)

1.1 導(dǎo)入演示數(shù)據(jù)(芯片數(shù)據(jù))

library(airway)
library(DESeq2)
data(airway)

# import data to DESeq2 and variance stabilize
dset = DESeqDataSetFromMatrix(assay(airway),
                              colData=as.data.frame(colData(airway)), design=~dex)
dset = estimateSizeFactors(dset)
dset = estimateDispersions(dset)
gene_expr = getVarianceStabilizedData(dset)

# annotate matrix with HGNC symbols
library(biomaRt)
mart = useDataset("hsapiens_gene_ensembl", useMart("ensembl"))
genes = getBM(attributes = c("ensembl_gene_id","hgnc_symbol"),
              values=rownames(gene_expr), mart=mart)
matched = match(rownames(gene_expr), genes$ensembl_gene_id)
rownames(gene_expr) = genes$hgnc_symbol[matched]
dim(gene_expr)
# [1] 64102     8
gene_expr[1:5,1:5]
#          SRR1039508 SRR1039509 SRR1039512 SRR1039513 SRR1039516
# TSPAN6     9.531699   9.170317   9.674546   9.421197  10.027595
# TNMD       5.302948   5.302948   5.302948   5.302948   5.302948
# DPM1       9.055928   9.347026   9.235703   9.278863   9.166625
# SCYL3      8.358430   8.273162   8.212763   8.316611   8.136760
# C1orf112   6.967075   7.001886   6.596359   6.882393   7.060850

1.2 分析和繪圖

library(progeny)
pathways = progeny(gene_expr, scale=FALSE)
controls = airway$dex == "untrt"
ctl_mean = apply(pathways[controls,], 2, mean)
ctl_sd = apply(pathways[controls,], 2, sd)
pathways = t(apply(pathways, 1, function(x) x - ctl_mean))
pathways = apply(pathways, 1, function(x) x / ctl_sd)

library(pheatmap)
myColor = colorRampPalette(c("Darkblue", "white","red"))(100)
pheatmap(t(pathways),fontsize=14, show_rownames = F,
         color=myColor, main = "PROGENy", angle_col = 45, treeheight_col = 0,  
         border_color = NA)

還可以加上分組標簽又活，看起來會更直觀

2. 分析單細胞數(shù)據(jù)

2.1 導(dǎo)入數(shù)據(jù)

library(Seurat)
library(progeny)
library(tidyr)
library(tibble)
pbmc <- readRDS("pbmc.rds") #注釋好的單細胞數(shù)據(jù)集

2.2 提取細胞類型標簽

查看每個細胞類型這14個通路的活性

## We create a data frame with the specification of the cells that belong to 
## each cluster to match with the Progeny scores.
CellsClusters <- data.frame(Cell = names(Idents(pbmc)), 
                            CellType = as.character(Idents(pbmc)),
                            stringsAsFactors = FALSE)
DimPlot(pbmc, reduction = "umap", label = TRUE, pt.size = 0.5) + NoLegend()

2.3 計算

## We compute the Progeny activity scores and add them to our Seurat object
## as a new assay called Progeny. 
pbmc <- progeny(pbmc, scale=FALSE, organism="Human", top=500, perm=1, 
                return_assay = TRUE)
pbmc@assays$progeny
# Assay data with 14 features for 2638 cells
# First 10 features:
# Androgen, EGFR, Estrogen, Hypoxia, JAK-STAT, MAPK, NFkB, p53, PI3K, TGFb

pbmc對象下面的assay槽下面多了progeny

pbmc@assays[["progeny"]]@data下儲存的是14個通路在2638個細胞中的評分

pbmc@assays[["progeny"]]@data[1:6,1:4]
#          AAACATACAACCAC-1 AAACATTGAGCTAC-1 AAACATTGATCAGC-1 AAACCGTGCTTCCG-1
# Androgen         86.88406         57.92163        94.287118        11.135108
# EGFR             28.34279        -15.00708        -2.652041         1.738702
# Estrogen        -51.13204        -67.55945       -64.452782       -37.103230
# Hypoxia          96.56731        122.76491       135.750523        96.936620
# JAK-STAT        163.11016        269.55272       315.408767       609.408980
# MAPK            -10.39436        -59.37868       -17.161151       -61.763826

2.4 整合同一細胞類型的評分

## We can now directly apply Seurat functions in our Progeny scores. 
## For instance, we scale the pathway activity scores. 
pbmc <- Seurat::ScaleData(pbmc, assay = "progeny") 

## We transform Progeny scores into a data frame to better handling the results
progeny_scores_df <- 
  as.data.frame(t(GetAssayData(pbmc, slot = "scale.data", 
                               assay = "progeny"))) %>%
  rownames_to_column("Cell") %>%
  gather(Pathway, Activity, -Cell) 
dim(progeny_scores_df)
# [1] 36932     3

## We match Progeny scores with the cell clusters.
progeny_scores_df <- inner_join(progeny_scores_df, CellsClusters)

## We summarize the Progeny scores by cellpopulation
summarized_progeny_scores <- progeny_scores_df %>% 
  group_by(Pathway, CellType) %>%
  summarise(avg = mean(Activity), std = sd(Activity))
dim(summarized_progeny_scores)
# [1] 126   4

## We prepare the data for the plot
summarized_progeny_scores_df <- summarized_progeny_scores %>%
  dplyr::select(-std) %>%   
  spread(Pathway, avg) %>%
  data.frame(row.names = 1, check.names = FALSE, stringsAsFactors = FALSE)

2.5 繪圖

paletteLength = 100
myColor = colorRampPalette(c("Darkblue", "white","red"))(paletteLength)

progenyBreaks = c(seq(min(summarized_progeny_scores_df), 0, 
                      length.out=ceiling(paletteLength/2) + 1),
                  seq(max(summarized_progeny_scores_df)/paletteLength, 
                      max(summarized_progeny_scores_df), 
                      length.out=floor(paletteLength/2)))
progeny_hmap = pheatmap(t(summarized_progeny_scores_df),fontsize=12, 
                        fontsize_row = 10, 
                        color=myColor, breaks = progenyBreaks, 
                        main = "PROGENy (500)", angle_col = 45,
                        treeheight_col = 0,  border_color = NA)

2.6 繪制單個通路的FeaturePlot

DefaultAssay(pbmc) <- 'progeny'
p1= FeaturePlot(pbmc,features = "NFkB", coord.fixed = T, order = T, cols = viridis(10))
p2=FeaturePlot(pbmc,features = "MAPK", coord.fixed = T, order = T, cols = viridis(10))
p1|p2

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

禁止轉(zhuǎn)載，如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者锰悼。

人面猴
序言：七十年代末柳骄，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子箕般，更是在濱河造成了極大的恐慌耐薯，老刑警劉巖，帶你破解...
沈念sama閱讀 217,185評論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件丝里，死亡現(xiàn)場離奇詭異曲初，居然都是意外死亡，警方通過查閱死者的電腦和手機丙者，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,652評論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門复斥，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人械媒，你說我怎么就攤上這事目锭∑捞” “怎么了？”我有些...
開封第一講書人閱讀 163,524評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵痢虹，是天一觀的道長被去。經(jīng)常有香客問我，道長奖唯，這世上最難降的妖魔是什么惨缆？我笑而不...
開封第一講書人閱讀 58,339評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮丰捷，結(jié)果婚禮上坯墨，老公的妹妹穿的比我還像新娘。我一直安慰自己病往，他們只是感情好捣染，可當我...
茶點故事閱讀 67,387評論 6贊 391
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著停巷，像睡著了一般耍攘。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上畔勤，一...
開封第一講書人閱讀 51,287評論 1贊 301
城市分裂傳說
那天蕾各，我揣著相機與錄音，去河邊找鬼庆揪。笑死式曲，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的嚷硫。我是一名探鬼主播检访，決...
沈念sama閱讀 40,130評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼仔掸！你這毒婦竟也來了脆贵？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,985評論 0贊 275
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤起暮，失蹤者是張志新（化名）和其女友劉穎卖氨，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體负懦，經(jīng)...
沈念sama閱讀 45,420評論 1贊 313
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡筒捺，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,617評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了纸厉。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片系吭。...
茶點故事閱讀 39,779評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖颗品，靈堂內(nèi)的尸體忽然破棺而出肯尺，到底是詐尸還是另有隱情沃缘，我是刑警寧澤，帶...
沈念sama閱讀 35,477評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布则吟，位于F島的核電站槐臀，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏氓仲。R本人自食惡果不足惜水慨，卻給世界環(huán)境...
茶點故事閱讀 41,088評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望敬扛。院中可真熱鬧晰洒，春花似錦、人聲如沸舔哪。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,716評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽捉蚤。三九已至，卻和暖如春炼七，著一層夾襖步出監(jiān)牢的瞬間缆巧，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,857評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工豌拙，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留陕悬，地道東北人。一個月前我還...
沈念sama閱讀 47,876評論 2贊 370
代替公主和親
正文我出身青樓按傅，卻偏偏與公主長得像捉超，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子唯绍，可洞房花燭夜當晚...
茶點故事閱讀 44,700評論 2贊 354