GEO單細(xì)胞測序數(shù)據(jù)生信分析復(fù)現(xiàn)

復(fù)現(xiàn)文章:Analyses of metastasis-associated genes in IDH wild-type glioma
數(shù)據(jù)來源:GSE84465
圖1


image.png

數(shù)據(jù)篩選條件


image.png

image.png

除了min.cells min.features percent.mt,還有Pearson相關(guān)系數(shù)的指標(biāo)(Fig S1)
根據(jù)Pearson相關(guān)系數(shù)大于0.4這個指標(biāo),去除了Tumor_BT_S1和Tumor_BT_S4兩個樣本沟蔑,只針對剩余的6個樣本分析
Fig S1
image.png

第一步:下載GSE84465_GBM_All_data.csv.gz和Metadata的SraRunTable.txt文件
第二步代碼

library(Seurat)
library(ggplot2)
library(clustree)
library(cowplot)
library(dplyr)


a<-read.table("GSE84465_GBM_All_data.csv.gz")
head(rownames(a))
tail(rownames(a),10)
a=a[1:(nrow(a)-5),]  #最后5行行名異常,剔除

b<-read.table("SraRunTable.txt",sep = ",",header = T)   #樣本信息
table(b$PATIENT_ID)
table(b$tissue)
table(b$tissue, b$PATIENT_ID)

new.b <- b[,c("Plate.ID","well","tissue","PATIENT_ID")]
new.b$sample <- paste0("X",b$Plate.ID,".",b$well)
head(new.b)
identical(colnames(a),new.b$sample)

pbmc <- CreateSeuratObject(counts = a)
head(pbmc@meta.data)

patient<-new.b$PATIENT_ID
pbmc <- AddMetaData(object = pbmc, metadata = patient, col.name = 'PATIENT_ID')
tissue<-new.b$tissue
pbmc <- AddMetaData(object = pbmc, metadata = tissue, col.name = 'Tissue')
sample<-paste0(tissue,"_",patient)
pbmc <- AddMetaData(object = pbmc, metadata = sample, col.name = 'Sample')
head(pbmc@meta.data)

pbmc[["percent.mt"]] <- PercentageFeatureSet(pbmc, pattern = "^MT-")

table(pbmc$PATIENT_ID,pbmc$Tissue)

###########################
#計算Pearson相關(guān)系數(shù)
pbmc.filt <- subset(pbmc, subset = PATIENT_ID=="BT_S6"&Tissue=="Periphery")    #BT_S1 2 4 6 Tumor Periphery
dim(pbmc.filt)

plot1 <- FeatureScatter(pbmc.filt, feature1 = "nCount_RNA", feature2 = "percent.mt",group.by = "PATIENT_ID",pt.size=1.5)
plot2 <- FeatureScatter(pbmc.filt, feature1 = "nCount_RNA", feature2 = "nFeature_RNA",group.by = "PATIENT_ID",pt.size=1.5)
plot1 + plot2
############################
selected_f <- rownames(pbmc)[Matrix::rowSums(pbmc@assays$RNA@counts > 0 ) > 3]
pbmc.filt <- subset(pbmc, subset = nFeature_RNA > 50 & nFeature_RNA < 6000 & percent.mt < 0.05 & 
                      Sample%in%c("Periphery_BT_S1","Periphery_BT_S2","Periphery_BT_S4","Periphery_BT_S6","Tumor_BT_S2","Tumor_BT_S6"),
                    features = selected_f)
dim(pbmc.filt)
VlnPlot(object = pbmc.filt, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"),group.by = "Sample")
image.png

image.png
#標(biāo)準(zhǔn)化
pbmc <- NormalizeData(pbmc, normalization.method = "LogNormalize", scale.factor = 10000)

### 鑒定高變異基因
pbmc <- FindVariableFeatures(pbmc, selection.method = "vst", nfeatures = 1500)   #變異最大的1500個基因

#輸出特征方差圖
top10 <- head(VariableFeatures(pbmc), 10)
plot1 <- VariableFeaturePlot(pbmc)
plot2 <- LabelPoints(plot = plot1, points = top10,repel = TRUE)
plot1+plot2
image.png

圖2


image.png
#標(biāo)準(zhǔn)化
pbmc <- NormalizeData(pbmc, normalization.method = "LogNormalize", scale.factor = 10000)

### 鑒定高變異基因
pbmc <- FindVariableFeatures(pbmc, selection.method = "vst", nfeatures = 500)   #變異最大的1500個基因

#輸出特征方差圖
top10 <- head(VariableFeatures(pbmc), 10)
plot1 <- VariableFeaturePlot(pbmc)
plot2 <- LabelPoints(plot = plot1, points = top10,repel = TRUE)
plot1+plot2


all.genes <- rownames(pbmc)
pbmc <- ScaleData(pbmc, features = all.genes)
pbmc <- ScaleData(pbmc, vars.to.regress = "percent.mt")

pbmc <- RunPCA(pbmc, features = VariableFeatures(object = pbmc))
print(pbmc[["pca"]], dims = 1:5, nfeatures = 5)


VizDimLoadings(object = pbmc, dims = 1:2, reduction = "pca",nfeatures = 20)  #4個PC 20個基因

DimPlot(pbmc, reduction = "pca",group.by="Sample")

DimHeatmap(pbmc, dims = 1:2, cells = 500, balanced = TRUE,nfeatures = 30,ncol=2)

pbmc <- JackStraw(object = pbmc, num.replicate = 100)
pbmc <- ScoreJackStraw(object = pbmc, dims = 1:20)
JackStrawPlot(object = pbmc, dims = 1:20,reduction = "pca")
ElbowPlot(pbmc,reduction="pca")  #根據(jù)ElbowPlot確定PC數(shù)量

##TSNE聚類分析
pbmc <- FindNeighbors(pbmc, dims = 1:20)   
pbmc <- FindClusters(pbmc, resolution = 0.5)  

#tSNE降維
pbmc <- RunTSNE(object = pbmc, dims = 1:20)   
DimPlot(pbmc, reduction = "tsne",label = TRUE,pt.size = 1)
image.png

image.png

image.png

image.png

image.png
table(pbmc@meta.data$Tissue,pbmc@meta.data$seurat_clusters)
image.png
### 差異表達(dá)分析
# 找到每一個cluster當(dāng)中的marker聘芜,并且只展示陽性的marker狼讨。
pbmc.markers <- FindAllMarkers(pbmc, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25)
head(pbmc.markers, n = 10)
write.table(pbmc.markers,file = 'pbmc.markers.txt',sep = '\t',row.names=F,quote=F)

library("tidyverse")
sig.markers<- pbmc.markers %>% select(gene,everything()) %>%
  subset(p_val_adj<0.05 & abs(pbmc.markers$avg_log2FC)>1)
dim(sig.markers)
write.table(sig.markers,file="sigmarkers.xls",sep="\t",row.names=F,quote=F)

top10 <- pbmc.markers %>% group_by(cluster) %>% top_n(n = 10, wt = avg_log2FC)
#差異基因可視化
VlnPlot(object = pbmc, features = c("EGFR", "CCL3","AGXT2L1","DCN","GPR17","MOG","SYT1"),group.by = "seurat_clusters",pt.size = 1)
image.png

Cluster 2 3 6被定義為metastatic tumor cell,比較metastatic和non-mentastatic之間的基因表達(dá)差異

metastatic.markers <- FindMarkers(pbmc, ident.1 = c(2,3,6), ident.2 = c(0,1,4,5,7,8,9,10,11,12), min.pct = 0.25)
head(metastatic.markers,10)
sig.metastatic.markers<- metastatic.markers %>% select(colnames(metastatic.markers),everything()) %>%
  subset(p_val_adj<0.05 & abs(metastatic.markers$avg_log2FC)>1)
dim(sig.metastatic.markers)
write.table(sig.metastatic.markers,file="sigmetastaticmarkers.xls",sep="\t",row.names=F,quote=F)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末铜犬,一起剝皮案震驚了整個濱河市柑肴,隨后出現(xiàn)的幾起案子锤悄,更是在濱河造成了極大的恐慌,老刑警劉巖嘉抒,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件零聚,死亡現(xiàn)場離奇詭異,居然都是意外死亡些侍,警方通過查閱死者的電腦和手機(jī)隶症,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來岗宣,“玉大人蚂会,你說我怎么就攤上這事『氖剑” “怎么了胁住?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長刊咳。 經(jīng)常有香客問我彪见,道長,這世上最難降的妖魔是什么娱挨? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任余指,我火速辦了婚禮,結(jié)果婚禮上跷坝,老公的妹妹穿的比我還像新娘酵镜。我一直安慰自己碉碉,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布淮韭。 她就那樣靜靜地躺著垢粮,像睡著了一般。 火紅的嫁衣襯著肌膚如雪靠粪。 梳的紋絲不亂的頭發(fā)上蜡吧,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機(jī)與錄音庇配,去河邊找鬼斩跌。 笑死绍些,一個胖子當(dāng)著我的面吹牛捞慌,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播柬批,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼啸澡,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了氮帐?” 一聲冷哼從身側(cè)響起嗅虏,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎上沐,沒想到半個月后皮服,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡参咙,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年龄广,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蕴侧。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡择同,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出净宵,到底是詐尸還是另有隱情敲才,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布择葡,位于F島的核電站紧武,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏敏储。R本人自食惡果不足惜脏里,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望虹曙。 院中可真熱鬧迫横,春花似錦番舆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至呛讲,卻和暖如春禾怠,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背贝搁。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工吗氏, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人雷逆。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓弦讽,卻偏偏與公主長得像,于是被迫代替她去往敵國和親膀哲。 傳聞我的和親對象是個殘疾皇子往产,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容