歡迎關(guān)注”生信修煉手冊”!
cell ranger輸出結(jié)果目錄結(jié)構(gòu)如下所示
├── analysis
│ ? ├── clustering
│ ? ├── diffexp
│ ? ├── pca
│ ? └── tsne
├── cloupe.cloupe
├── filtered_feature_bc_matrix.h5
├── filtered_gene_bc_matrices
│ ? └── GRCh38
├── metrics_summary.csv
├── molecule_info.h5
├── possorted_genome_bam.bam
├── possorted_genome_bam.bam.bai
├── raw_feature_bc_matrix
│ ? ├── barcodes.tsv.gz
│ ? ├── features.tsv.gz
│ ? └── matrix.mtx.gz
├── raw_feature_bc_matrix.h5
└── web_summary.html
輸出文件非常的多,為了方便查看結(jié)果询刹,提供了一個所有結(jié)果匯總的html
頁面谜嫉,即web_summary.html
。該網(wǎng)頁的結(jié)果分成了summary
和analysis
兩部分凹联, summary
部分包含如下結(jié)果
1. 異常結(jié)果警告
如果數(shù)據(jù)中存在異常骄恶,在網(wǎng)頁的頭部會給黃色的警告框,如下所示
點(diǎn)擊Details
, 可以看到詳細(xì)的信息匕垫,上圖顯示RNA reads的Q30比例太低僧鲁,理想情況是大于65%, 而實際的數(shù)據(jù)只有64.4%象泵。
2. 細(xì)胞和基因數(shù)目的評估
對樣本中的細(xì)胞和表達(dá)的基因個數(shù)評估寞秃,同時還給出了barcode, index, umi, RNA reads不同序列的Q30, 示意如下
3. 比對比例統(tǒng)計
統(tǒng)計reads的比對比例偶惠,同時給出比對到基因間區(qū)春寿,外顯子,內(nèi)含子的比例忽孽,示意如下
4. ?細(xì)胞數(shù)目評估詳細(xì)信息
通過barcode上的UMI標(biāo)簽分布來評估細(xì)胞數(shù)目绑改,深藍(lán)色代表細(xì)胞谢床,灰色代表背景,示意如下
5. ?樣本基本信息
樣本名稱厘线,使用的參考基因組等信息识腿,示意如下
analysis
部分包含如下結(jié)果
1. ?細(xì)胞表達(dá)量分布的t-SNE圖
UMI
標(biāo)簽用于標(biāo)識轉(zhuǎn)錄本,UMI
的count值就是轉(zhuǎn)錄本的表達(dá)量造壮,采用tSNE
降維算法渡讼, 對細(xì)胞的表達(dá)量進(jìn)行可視化,每個點(diǎn)代表一個細(xì)胞耳璧,示意如下
2. 細(xì)胞亞型
根據(jù)表達(dá)量對細(xì)胞進(jìn)行聚類成箫,從而識別細(xì)胞亞型,提供了兩種聚類算法graph-based
和k-means
, 示意如下
通過右上角的下拉按鈕旨枯,可以查看不同的聚類結(jié)果蹬昌,結(jié)果展示依然是用的t-SNE
圖,只不過根據(jù)聚類結(jié)果對顏色進(jìn)行了調(diào)整攀隔,屬于同一類的細(xì)胞用相同顏色表示凳厢。
3. ?基因差異表達(dá)分析
對cluster下的基因進(jìn)行差異分析,將細(xì)胞分成了該cluster和其他cluster兩類竞慢,然后進(jìn)行差異分析先紫,結(jié)果如下所示
4. 飽和度評估
對reads抽樣,觀察不同抽樣條件下檢測到的轉(zhuǎn)錄本數(shù)量占檢測到的所有轉(zhuǎn)錄本的比例筹煮,并繪制如下曲線
如果曲線末端區(qū)域平滑遮精,說明測序接近飽和,再增加測序量败潦,覆蓋到的轉(zhuǎn)錄本數(shù)目也不會變化太多本冲。
對reads抽樣,觀察不同測序數(shù)據(jù)量情況下檢測到的基因數(shù)目的分布劫扒,并繪制如下曲線
如果曲線末端區(qū)域平滑檬洞,說明測序接近飽和,再增加測序量沟饥,檢測到的基因數(shù)目也不會變化太多添怔。
網(wǎng)頁提供了一個簡單直觀的查看結(jié)果的方式,但是很多細(xì)節(jié)還是需要到對應(yīng)的文件中進(jìn)行查找贤旷。網(wǎng)頁中summary
部分的結(jié)果保存在metrics_summary.csv
文件中广料,analysis
部分結(jié)果保存在名為analysis
的文件夾下,該文件夾包含以下4個子目錄
├── clustering
├── diffexp
├── pca
└── tsne
pca
是表達(dá)量的PCA分析結(jié)果幼驶,tsne
是表達(dá)來量的t-SNE分析結(jié)果艾杏,diffexp
是差異分析的結(jié)果,clustering
是聚類的結(jié)果盅藻,每個聚類結(jié)果都提供了一個cluster.csv
文件购桑,內(nèi)容示意如下
可以看到barcode和cluster的對應(yīng)關(guān)系畅铭,barcode用于標(biāo)識細(xì)胞,這張表格反映的是細(xì)胞和cluster的對應(yīng)關(guān)系勃蜘。
在結(jié)果目錄硕噩,可以看到如下兩個目錄
raw_feature_bc_matrix
-
filtered_gene_bc_matrices
這兩個目錄下的內(nèi)容是類似的,raw
目錄下是所有的barcode信息元旬,包含了細(xì)胞相關(guān)的barcoed和背景barcode,而filter
目錄下只包含細(xì)胞相關(guān)的barcode信息榴徐,內(nèi)容如下
├── barcodes.tsv
├── genes.tsv
└── matrix.mtx
后綴為mtx
的文件記錄的就是基因的表達(dá)量信息守问,可以導(dǎo)入R或者python中查看匀归,也可以通過如下命令轉(zhuǎn)換為csv格式
cellranger mat2csv \
outs/filtered_gene_bc_matrices \
sample.count.csv
除了用MEX
格式來存儲表達(dá)量數(shù)據(jù),還使用用HDF5的格式來記錄表達(dá)量信息耗帕,對應(yīng)以下兩個文件
raw_feature_bc_matrix.h5
-
filtered_feature_bc_matrix.h5
在輸出目錄下穆端,還包含以下幾個文件
possorted_genome_bam.bam
possorted_genome_bam.bam.bai
molecule_info.h5
-
cloupe.cloupe
前兩個是比對產(chǎn)生的bam文件和索引,第三個文件是實驗相關(guān)的文庫仿便,GEM体啰,barcode表達(dá)量等信息的HDF5格式的文件,cloupe
文件則是Loupe Cell Browser的輸入文件嗽仪,該軟件是官方提供的專門用于查看數(shù)據(jù)分析結(jié)果的軟件, 后續(xù)會介紹該軟件的使用荒勇。
·end·
—如果喜歡,快分享給你的朋友們吧—
掃描關(guān)注微信號闻坚,更多精彩內(nèi)容等著你沽翔!