RNA速率分析流程

image.png

示例數(shù)據(jù):GSE178911→GSM5400792→ SRR14915863~SRR14915866

https://sra-download.ncbi.nlm.nih.gov/traces/sra7/SRZ/014915/SRR14915863/201008_D0_scRNA_fastq_S1_L001_R1_001.fastq.gz
https://sra-download.ncbi.nlm.nih.gov/traces/sra7/SRZ/014915/SRR14915863/201008_D0_scRNA_fastq_S1_L001_R2_001.fastq.gz
https://sra-download.ncbi.nlm.nih.gov/traces/sra30/SRZ/014915/SRR14915864/201008_D0_scRNA_fastq_S1_L002_R1_001.fastq.gz
https://sra-download.ncbi.nlm.nih.gov/traces/sra30/SRZ/014915/SRR14915864/201008_D0_scRNA_fastq_S1_L002_R2_001.fastq.gz
https://sra-download.ncbi.nlm.nih.gov/traces/sra51/SRZ/014915/SRR14915865/201008_D0_scRNA_fastq_S1_L003_R1_001.fastq.gz
https://sra-download.ncbi.nlm.nih.gov/traces/sra51/SRZ/014915/SRR14915865/201008_D0_scRNA_fastq_S1_L003_R2_001.fastq.gz
https://sra-download.ncbi.nlm.nih.gov/traces/sra67/SRZ/014915/SRR14915866/201008_D0_scRNA_fastq_S1_L004_R1_001.fastq.gz
https://sra-download.ncbi.nlm.nih.gov/traces/sra67/SRZ/014915/SRR14915866/201008_D0_scRNA_fastq_S1_L004_R2_001.fastq.gz

1、cellranger比對(linux)

  • 其次下載該軟件團隊提供的配套的參考基因組文件,有人/鼠的盒延,按需下載、解壓弟跑、備用。


  • 開始比對~~~

bin=~/biosoft/cellranger-6.0.2/bin/cellranger
db=./refdata-gex-GRCh38-2020-A
fq_dir=./fastq/GSM5400792

$bin count --id=201008_D0_scRNA_fastq \
--localcores=10 \
--transcriptome=$db \
--fastqs=$fq_dir \
--sample=201008_D0_scRNA_fastq \
--expect-cells=3000 \
--nosecondary
#比對時間視使用線程數(shù)而定
  • 查看比對結(jié)果out文件夾

2防症、velocyto生成loom文件(linux)

conda create -n velocyto 
conda activate velocyto 
conda install samtools
conda install numpy scipy cython numba matplotlib scikit-learn h5py click
pip install pysam
 # `PyPI`安裝
pip install velocyto
  • 下載基因組gtf注釋文件
    需要兩個孟辑,一個是標(biāo)準(zhǔn)的基因組gtf注釋文件,在上一步下載的refdata-gex-GRCh38-2020-A文件夾里已有蔫敲。

    另一個是對repeat region注釋的gtf文件

http://velocyto.org/velocyto.py/tutorial/cli.html
You might want to mask expressed repetitive elements, since those count could constitute a confounding factor in the downstream analysis. To do so you would need to download an appropriate expressed repeat annotation (for example from UCSC genome browser and make sure to select GTF as output format).
https://genome.ucsc.edu/cgi-bin/hgTables?hgsid=611454127_NtvlaW6xBSIRYJEBI0iRDEWisITa&clade=mammal&org=Human&db=0&hgta_group=allTracks&hgta_track=rmsk&hgta_table=rmsk&hgta_regionType=genome&position=&hgta_outputType=gff&hgta_outFileName=mm10_rmsk.gtf

  • 開始分析
cellranger_outDir=201008_D0_scRNA_fastq
cellranger_gtf=refdata-gex-GRCh38-2020-A/genes/genes.gtf
rmsk_gtf=rmsk.gtf
ls -lh $rmsk_gtf  $cellranger_outDir $cellranger_gtf

velocyto run10x -m $rmsk_gtf  $cellranger_outDir $cellranger_gtf
#比較耗時
  • 結(jié)果儲存在cellranger_outDir文件夾里的velocyto/子文件夾里

3饲嗽、Seurat標(biāo)準(zhǔn)流程分析(Rstudio)

  • 使用Seurat包對filtered_feature_bc_matrix文件夾的三個文件(feature/barcode/matrix)進行標(biāo)準(zhǔn)流程分析
  • 其中必須包括tSNE/uMAP降維,以及cluster/celltype分群注釋信息奈嘿。
  • 可參看以前筆記貌虾,就不多做介紹了~

4 、velocyto.R速率分析裙犹、可視化(linux環(huán)境的R)

library(Seurat)
library(velocyto.R)
library(tidyverse)
# sce_all = readRDS("sce.rds")
# sce_all  = SplitObject(sce_all, split.by = "orig.ident")
# sce_1 = sce_all[[1]]
sce_1 = readRDS("sce.rds")
sce_1@assays$RNA@counts[1:4,1:4]
velo_1 <- read.loom.matrices("201008_D0_scRNA_fastq.loom")
velo_1$spliced[1:4,1:4]


#以Seurat對象為標(biāo)準(zhǔn),統(tǒng)一loom文件里的細(xì)胞名和數(shù)量
colnames(velo_1$spliced)<-gsub("x","-1",colnames(velo_1$spliced))
colnames(velo_1$spliced)<-gsub("201008_D0_scRNA_fastq:","1_",colnames(velo_1$spliced))
colnames(velo_1$unspliced)<-colnames(velo_1$spliced)
colnames(velo_1$ambiguous)<-colnames(velo_1$spliced)

velo_1$spliced<-velo_1$spliced[,rownames(sce_1@meta.data)]
velo_1$unspliced<-velo_1$unspliced[,rownames(sce_1@meta.data)]
velo_1$ambiguous<-velo_1$ambiguous[,rownames(sce_1@meta.data)]

#速率分析
sp <- velo_1$spliced
unsp <- velo_1$unspliced
sce_1_umap <- sce_1@reductions$umap@cell.embeddings
ident.colors <- (scales::hue_pal())(n = length(x = levels(x = sce_1)))
names(x = ident.colors) <- levels(x = sce_1)
cell.colors <- ident.colors[Idents(object = sce_1)]
names(x = cell.colors) <- colnames(x = sce_1)
fit.quantile = 0.02
cell.dist <- as.dist(1-armaCor(t(sce_1@reductions$pca@cell.embeddings)))
rvel.cd <- gene.relative.velocity.estimates(sp,unsp,deltaT=2, kCells=10, 
                                            cell.dist=cell.dist,fit.quantile=fit.quantile,n.cores=24)

#可視化
Idents(sce_1) = "fine"
gg <- UMAPPlot(sce_1)
colors <- as.list(ggplot_build(gg)$data[[1]]$colour)
names(colors) <- rownames(sce_1_umap)
show.velocity.on.embedding.cor(sce_1_umap,rvel.cd,n=30,scale='sqrt',cell.colors=ac(colors,alpha=0.5),cex=0.8,arrow.scale=2,show.grid.flow=T,min.grid.cell.mass=1.0,grid.n=50,arrow.lwd=1,do.par=F,cell.border.alpha =0.1,USE_OPENMP=1,n.cores=24,main="Cell Velocity")
#比較耗時~~

在加載Seurat對象時,可以僅提取感興趣的亞群琐簇,進行分析~

  • 關(guān)于RNA速率分析的背景渣叛、結(jié)果解讀之后再學(xué)習(xí)一下~蘑秽。但從上面的流程來收看,還是比較復(fù)雜的缀雳。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末竖独,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子竞膳,更是在濱河造成了極大的恐慌,老刑警劉巖滨彻,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件梁厉,死亡現(xiàn)場離奇詭異,居然都是意外死亡喜德,警方通過查閱死者的電腦和手機睡雇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門观蓄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來歌径,“玉大人克锣,你說我怎么就攤上這事∨卟玻” “怎么了喻犁?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵何缓,是天一觀的道長肢础。 經(jīng)常有香客問我,道長碌廓,這世上最難降的妖魔是什么传轰? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮谷婆,結(jié)果婚禮上慨蛙,老公的妹妹穿的比我還像新娘。我一直安慰自己纪挎,他們只是感情好期贫,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著异袄,像睡著了一般通砍。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上烤蜕,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天封孙,我揣著相機與錄音,去河邊找鬼讽营。 笑死虎忌,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的斑匪。 我是一名探鬼主播呐籽,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蚀瘸!你這毒婦竟也來了狡蝶?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤贮勃,失蹤者是張志新(化名)和其女友劉穎贪惹,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體寂嘉,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡奏瞬,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年枫绅,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片硼端。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡并淋,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出珍昨,到底是詐尸還是另有隱情县耽,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布镣典,位于F島的核電站兔毙,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏兄春。R本人自食惡果不足惜澎剥,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望赶舆。 院中可真熱鬧哑姚,春花似錦、人聲如沸涌乳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽夕晓。三九已至宛乃,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蒸辆,已是汗流浹背征炼。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留躬贡,地道東北人谆奥。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓砾层,卻偏偏與公主長得像南捂,于是被迫代替她去往敵國和親百侧。 傳聞我的和親對象是個殘疾皇子娄蔼,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容