001-Seurat介紹和數(shù)據(jù)質(zhì)控

4.0 安裝包

install.packages('Seurat')

加載所需要的包

library(Seurat)
library(tidyverse)
library(dplyr)
library(patchwork)

清除環(huán)境静汤,

rm(list=ls())

讀取10x的數(shù)據(jù)

BC10 文件夾內(nèi)容

4640_0.png
scRNA.counts=Read10X("F:/006_data/BC10")
class(scRNA.counts)

scRNA.counts是一個S4對象逆甜。S4對象就像一顆大樹一樣教藻,有主枝干篡悟,有分枝谜叹。

4642_0.png

創(chuàng)建Seurat對象

?CreateSeuratObject
scRNA = CreateSeuratObject(scRNA.counts ,min.cells = 3,project="os", min.features = 300)
view(scRNA)

min.cells 每個基因至少要在3個細胞中表達

min.features 每個細胞至少有多少基因表達/被檢測到

查看樣本的細胞數(shù)量

第一種s4對象的提取方法 點擊白框

第二提取s4對象的方法 @ $交替使用

一般來說S4第一個用@
先輸入枝干scRNA@assays$RNA@counts@Dim

table(scRNA@meta.data$orig.ident)

計算質(zhì)控指標匾寝,去除低質(zhì)量的細胞

計算細胞中線粒體基因比例,線粒體基因公認是一定要去除的荷腊。

1 線粒體是獨立遺傳的艳悔,不是染色體上基因控制的。

2 單細胞測序一般都是新鮮的組織女仰,防止mRNA降解猜年,臨床新鮮的。防止線粒體快速擴增疾忍。 不新鮮乔外,線粒體不會占比太高,線粒體占比太高一罩,細胞可能凋亡或壞死杨幼。

scRNA[[]]
scRNA[["percent.mt"]] <- PercentageFeatureSet(scRNA, pattern = "^MT-")
x <- PercentageFeatureSet(scRNA, pattern = "^MT-")

x列名是BULK細胞標簽,行名是線粒體在每個基因的占比

4646_1.png

線粒體基因都是用MT-開頭命名的聂渊。用正則表達式^符號表示從首字母開始MT進行匹配提取差购。

計算紅細胞比例,紅細胞沒有細胞核歧沪,沒有轉(zhuǎn)錄組

HB.genes <- c("HBA1","HBA2","HBB","HBD","HBE1","HBG1","HBG2","HBM","HBQ1","HBZ")
HB_m <- match(HB.genes, rownames(scRNA@assays$RNA)) 
HB.genes <- rownames(scRNA@assays$RNA)[HB_m] 
HB.genes <- HB.genes[!is.na(HB.genes)] 
scRNA[["percent.HB"]]<-PercentageFeatureSet(scRNA, features=HB.genes) 
col.num <- length(levels(scRNA@active.ident))

Feature歹撒、count莲组、線粒體基因诊胞、紅細胞基因占比可視化。

violin <- VlnPlot(scRNA,
                  features = c("nFeature_RNA", "nCount_RNA", "percent.mt","percent.HB"), 
                  cols =rainbow(col.num), 
                  pt.size = 0.01, #不需要顯示點锹杈,可以設置pt.size = 0
                  ncol = 4) + 
  theme(axis.title.x=element_blank(), axis.text.x=element_blank(), axis.ticks.x=element_blank()) 

把圖片畫到畫板上面

violin
4644_0.png

保存

ggsave("vlnplot_before_qc.pdf", plot = violin, width = 12, height = 6) 
ggsave("vlnplot_before_qc.png", plot = violin, width = 12, height = 6)  

這幾個指標之間的相關性撵孤。 把圖畫到畫板上,然后手動保存

plot1=FeatureScatter(scRNA, feature1 = "nCount_RNA", feature2 = "percent.mt")
plot2=FeatureScatter(scRNA, feature1 = "nCount_RNA", feature2 = "nFeature_RNA")
plot3=FeatureScatter(scRNA, feature1 = "nCount_RNA", feature2 = "percent.HB")
pearplot <- CombinePlots(plots = list(plot1, plot2, plot3), nrow=1, legend="none") 

看畫板

plot1
plot2
plot3
pearplot

我們可以看到竭望,nFeature_RNA的范圍在0到8000之內(nèi)邪码,每個細胞基因表達量

percent.mt代表線粒體含量

percent.HB代表紅細胞含量

我們默認線粒體含量至少要小于10%,這是根據(jù)生物學知識得出的默認閾值咬清。紅細胞的數(shù)目要至少小于3%

至于nFeature_RNA和nCount_RNA的閾值怎么確定闭专,這個要結合 pearplot的圖來判斷。我們質(zhì)控的目標就是刪除離異值旧烧。而且注意閾值盡可能取的寬松一下影钉,防止后面分析想要的細胞得不到。

接下來從pearplot的圖片來做質(zhì)控---剔除離異值

nFeature_RNA選擇大于300 小于7000的 nFeature_RNA選擇小于100000掘剪,percent.mt小于10平委,percent.HB小于3

scRNA1 <- subset(scRNA, subset = nFeature_RNA > 300& nFeature_RNA < 7000 & percent.mt < 10 & percent.HB < 3 & nCount_RNA < 100000)
scRNA
scRNA1

在控制臺中我們可以看到有500多細胞過濾了

過濾完之后 我們就要對數(shù)據(jù)進行均一化,使用NormalizeData這個函數(shù)夺谁。

注意均一化是用NormalizeData廉赔,標準化是用ScaleData

scRNA1 <- NormalizeData(scRNA1, normalization.method = "LogNormalize", scale.factor = 10000)

好了肉微,這一節(jié)數(shù)據(jù)加載、質(zhì)控的內(nèi)容就算是做完了蜡塌。

在我們關閉rstudio之前 先把環(huán)境中運行好的數(shù)據(jù)保存一下

數(shù)據(jù)將保存在之前設定好的路徑中碉纳。還有保存的scRNA1,不是scRNA馏艾,因為scRNA1才是過濾好的數(shù)據(jù)村象。

save(scRNA1,file='scRNA1.Rdata')
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市攒至,隨后出現(xiàn)的幾起案子厚者,更是在濱河造成了極大的恐慌,老刑警劉巖迫吐,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件库菲,死亡現(xiàn)場離奇詭異,居然都是意外死亡志膀,警方通過查閱死者的電腦和手機熙宇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來溉浙,“玉大人烫止,你說我怎么就攤上這事〈粱” “怎么了馆蠕?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長惊奇。 經(jīng)常有香客問我互躬,道長,這世上最難降的妖魔是什么颂郎? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任吼渡,我火速辦了婚禮,結果婚禮上乓序,老公的妹妹穿的比我還像新娘寺酪。我一直安慰自己,他們只是感情好替劈,可當我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布寄雀。 她就那樣靜靜地躺著,像睡著了一般抬纸。 火紅的嫁衣襯著肌膚如雪咙俩。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天,我揣著相機與錄音阿趁,去河邊找鬼膜蛔。 笑死,一個胖子當著我的面吹牛脖阵,可吹牛的內(nèi)容都是我干的皂股。 我是一名探鬼主播,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼命黔,長吁一口氣:“原來是場噩夢啊……” “哼呜呐!你這毒婦竟也來了?” 一聲冷哼從身側響起悍募,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤蘑辑,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后坠宴,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體洋魂,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年喜鼓,在試婚紗的時候發(fā)現(xiàn)自己被綠了副砍。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡庄岖,死狀恐怖豁翎,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情隅忿,我是刑警寧澤心剥,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站硼控,受9級特大地震影響刘陶,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜牢撼,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望疑苫。 院中可真熱鬧熏版,春花似錦、人聲如沸捍掺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽挺勿。三九已至曲横,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背禾嫉。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工灾杰, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人熙参。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓艳吠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親孽椰。 傳聞我的和親對象是個殘疾皇子昭娩,可洞房花燭夜當晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容