Scillus——提高scRNA-seq數(shù)據(jù)的處理和可視化(二)

數(shù)據(jù)處理

1.加載原始數(shù)據(jù)

首先要加載 scRNA-seq 原始數(shù)據(jù):

library(Scillus)
library(tidyverse)
library(Seurat)
library(magrittr)

scRNA <- load_scfile(m)

Scillus 將為每個(gè)樣本創(chuàng)建Seurat對(duì)象并自動(dòng)調(diào)用PercentageFeatureSet()函數(shù)來(lái)計(jì)算線粒體基因百分比次屠。得到的scRNA結(jié)果是多個(gè) Seurat 對(duì)象的列表。它的長(zhǎng)度等于原始數(shù)據(jù)的行數(shù)m

length(scRNA)

[1] 6

2.繪制質(zhì)控圖

QC 圖可以由plot_qc()繪制。可以使用 ggplot 的語(yǔ)法自定義生成相應(yīng)的圖(如axis.title、theme 等)怠缸。

plot_qc(scRNA, metrics = "percent.mt")
每個(gè)樣本中的線粒體基因百分比
plot_qc(scRNA, metrics = "nFeature_RNA")
每個(gè)樣本中檢測(cè)到的基因數(shù)量
plot_qc(scRNA, metrics = "nCount_RNA")
每個(gè)樣本中的 UMI 數(shù)量

plot_qc()有3個(gè)可選參數(shù):plot_typegroup_by,和pal_setup帘皿。

默認(rèn)值plot_type就是"combined",這意味著這兩個(gè)箱形圖和小提琴同時(shí)繪制畸陡。如果僅首選兩個(gè)繪圖中的一個(gè)鹰溜,則可以將其設(shè)置為"box""violin"虽填。

plot_qc(scRNA, metrics = "percent.mt", plot_type = "box")
每個(gè)樣本中的線粒體基因所占百分比(箱線圖)

"density"用于繪制密度圖。請(qǐng)注意曹动,可以添加額外的 ggplot 語(yǔ)法(此處為log10轉(zhuǎn)換)斋日。

plot_qc(scRNA, metrics = "nCount_RNA", plot_type = "density") + scale_x_log10()
每個(gè)樣本中的 UMI 數(shù)量(密度圖,log10 轉(zhuǎn)換

group_by的默認(rèn)值是"sample"墓陈,其對(duì)應(yīng)于sample在原始數(shù)據(jù)列表m桑驱。由于加載過(guò)程中包含metadata數(shù)據(jù),QC 質(zhì)控結(jié)果也可以通過(guò)這些因素繪制跛蛋,例如"group"group對(duì)應(yīng)于metadata數(shù)據(jù)中的列m)熬的。

plot_qc(scRNA, metrics = "percent.mt", group_by = "group")
每組UMI數(shù)量

該參數(shù)pal_setup支持三種類型的輸入:

  • RColorBrewer調(diào)色板名稱
  • 調(diào)色板設(shè)置數(shù)據(jù)框(查看上一節(jié)的最后一部分)
  • 手動(dòng)指定的顏色向量。默認(rèn)值是調(diào)色板"Set2"
plot_qc(scRNA, metrics = "percent.mt", group_by = "group", pal_setup = "Accent")
每組線粒體read百分比(RColorBrewer 調(diào)色板名稱作為調(diào)色板輸入)
plot_qc(scRNA, metrics = "percent.mt", group_by = "group", pal_setup = pal)
每組中的線粒體read百分比(配置數(shù)據(jù)框作為調(diào)色板輸入)
plot_qc(scRNA, metrics = "percent.mt", group_by = "group", pal_setup = c("purple","yellow"))
每組線粒體read百分比(手動(dòng)指定顏色作為調(diào)色板輸入)

3.過(guò)濾和整合

filter_scdata()函數(shù)用于 Seurat 對(duì)象子集化赊级。subset參數(shù)的語(yǔ)法與Seurat 對(duì)象的subset()函數(shù)相同押框。將自動(dòng)繪制條形圖以顯示過(guò)濾前后的細(xì)胞數(shù)量。

scRNA_f <- filter_scdata(scRNA, subset = nFeature_RNA > 500 & percent.mt < 10)
過(guò)濾前后的細(xì)胞數(shù)

過(guò)濾后的 Seurat 對(duì)象列表scRNA_f將由Seurat 標(biāo)準(zhǔn)流程進(jìn)一步處理:

scRNA_f %<>% 
        purrr::map(.f = NormalizeData) %>%
        purrr::map(.f = FindVariableFeatures) %>%
        purrr::map(.f = CellCycleScoring, 
                   s.features = cc.genes$s.genes, 
                   g2m.features = cc.genes$g2m.genes)

Seurat 對(duì)象列表scRNA_f可以合并為一個(gè)單獨(dú)的 Seurat 對(duì)象scRNA_int以進(jìn)行整合分析:

scRNA_int <- IntegrateData(anchorset = FindIntegrationAnchors(object.list = scRNA_f, dims = 1:30, k.filter = 50), dims = 1:30)
scRNA_int %<>%
        ScaleData(vars.to.regress = c("nCount_RNA", "percent.mt", "S.Score", "G2M.Score"))

scRNA_int %<>%
        RunPCA(npcs = 50, verbose = TRUE)

scRNA_int %<>%
        RunUMAP(reduction = "pca", dims = 1:20, n.neighbors = 30) %>%
        FindNeighbors(reduction = "pca", dims = 1:20) %>%
        FindClusters(resolution = 0.3)

4.Factoring

通過(guò)refactor_seurat()分解Seurat對(duì)象元數(shù)據(jù)是一個(gè)可選步驟理逊,主要是為了更好地繪圖橡伞。該函數(shù)將元數(shù)據(jù)m作為參數(shù),并使Seurat對(duì)象元數(shù)據(jù)與m中的元數(shù)據(jù)相同的因子級(jí)別晋被。如果沒(méi)有提供metadata參數(shù)兑徘。Seurat 對(duì)象元數(shù)據(jù)中的所有字符向量都將被分解。

m %<>%
        mutate(group = factor(group, levels = c("Normal", "CTCL")))

scRNA_int %<>%
        refactor_seurat(metadata = m)

參考文獻(xiàn):
https://github.com/xmc811/Scillus

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末羡洛,一起剝皮案震驚了整個(gè)濱河市挂脑,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌欲侮,老刑警劉巖崭闲,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異威蕉,居然都是意外死亡刁俭,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門韧涨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)牍戚,“玉大人,你說(shuō)我怎么就攤上這事虑粥∪缧ⅲ” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵舀奶,是天一觀的道長(zhǎng)暑竟。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么但荤? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任罗岖,我火速辦了婚禮,結(jié)果婚禮上腹躁,老公的妹妹穿的比我還像新娘桑包。我一直安慰自己,他們只是感情好纺非,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布哑了。 她就那樣靜靜地躺著,像睡著了一般烧颖。 火紅的嫁衣襯著肌膚如雪弱左。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,292評(píng)論 1 301
  • 那天炕淮,我揣著相機(jī)與錄音拆火,去河邊找鬼。 笑死涂圆,一個(gè)胖子當(dāng)著我的面吹牛们镜,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播润歉,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼模狭,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了踩衩?” 一聲冷哼從身側(cè)響起嚼鹉,我...
    開(kāi)封第一講書(shū)人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎九妈,沒(méi)想到半個(gè)月后反砌,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡萌朱,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了策菜。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片晶疼。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖又憨,靈堂內(nèi)的尸體忽然破棺而出翠霍,到底是詐尸還是另有隱情,我是刑警寧澤蠢莺,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布寒匙,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏锄弱。R本人自食惡果不足惜考蕾,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望会宪。 院中可真熱鬧肖卧,春花似錦、人聲如沸掸鹅。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)巍沙。三九已至葵姥,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間句携,已是汗流浹背榔幸。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留务甥,地道東北人牡辽。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像敞临,于是被迫代替她去往敵國(guó)和親态辛。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容