cell ranger分析結(jié)果詳細(xì)解讀

歡迎關(guān)注”生信修煉手冊”!

cell ranger輸出結(jié)果目錄結(jié)構(gòu)如下所示

├── analysis
│ ? ├── clustering
│ ? ├── diffexp
│ ? ├── pca
│ ? └── tsne
├── cloupe.cloupe
├── filtered_feature_bc_matrix.h5
├── filtered_gene_bc_matrices
│ ? └── GRCh38
├── metrics_summary.csv
├── molecule_info.h5
├── possorted_genome_bam.bam
├── possorted_genome_bam.bam.bai
├── raw_feature_bc_matrix
│ ? ├── barcodes.tsv.gz
│ ? ├── features.tsv.gz
│ ? └── matrix.mtx.gz
├── raw_feature_bc_matrix.h5
└── web_summary.html

輸出文件非常的多,為了方便查看結(jié)果询刹,提供了一個所有結(jié)果匯總的html頁面谜嫉,即web_summary.html。該網(wǎng)頁的結(jié)果分成了summaryanalysis兩部分凹联, summary部分包含如下結(jié)果

1. 異常結(jié)果警告

如果數(shù)據(jù)中存在異常骄恶,在網(wǎng)頁的頭部會給黃色的警告框,如下所示


點(diǎn)擊Details, 可以看到詳細(xì)的信息匕垫,上圖顯示RNA reads的Q30比例太低僧鲁,理想情況是大于65%, 而實際的數(shù)據(jù)只有64.4%象泵。

2. 細(xì)胞和基因數(shù)目的評估

對樣本中的細(xì)胞和表達(dá)的基因個數(shù)評估寞秃,同時還給出了barcode, index, umi, RNA reads不同序列的Q30, 示意如下

3. 比對比例統(tǒng)計

統(tǒng)計reads的比對比例偶惠,同時給出比對到基因間區(qū)春寿,外顯子,內(nèi)含子的比例忽孽,示意如下

4. ?細(xì)胞數(shù)目評估詳細(xì)信息

通過barcode上的UMI標(biāo)簽分布來評估細(xì)胞數(shù)目绑改,深藍(lán)色代表細(xì)胞谢床,灰色代表背景,示意如下

5. ?樣本基本信息

樣本名稱厘线,使用的參考基因組等信息识腿,示意如下

analysis部分包含如下結(jié)果

1. ?細(xì)胞表達(dá)量分布的t-SNE圖

UMI標(biāo)簽用于標(biāo)識轉(zhuǎn)錄本,UMI的count值就是轉(zhuǎn)錄本的表達(dá)量造壮,采用tSNE降維算法渡讼, 對細(xì)胞的表達(dá)量進(jìn)行可視化,每個點(diǎn)代表一個細(xì)胞耳璧,示意如下

2. 細(xì)胞亞型

根據(jù)表達(dá)量對細(xì)胞進(jìn)行聚類成箫,從而識別細(xì)胞亞型,提供了兩種聚類算法graph-basedk-means, 示意如下

通過右上角的下拉按鈕旨枯,可以查看不同的聚類結(jié)果蹬昌,結(jié)果展示依然是用的t-SNE圖,只不過根據(jù)聚類結(jié)果對顏色進(jìn)行了調(diào)整攀隔,屬于同一類的細(xì)胞用相同顏色表示凳厢。

3. ?基因差異表達(dá)分析

對cluster下的基因進(jìn)行差異分析,將細(xì)胞分成了該cluster和其他cluster兩類竞慢,然后進(jìn)行差異分析先紫,結(jié)果如下所示

4. 飽和度評估

對reads抽樣,觀察不同抽樣條件下檢測到的轉(zhuǎn)錄本數(shù)量占檢測到的所有轉(zhuǎn)錄本的比例筹煮,并繪制如下曲線

如果曲線末端區(qū)域平滑遮精,說明測序接近飽和,再增加測序量败潦,覆蓋到的轉(zhuǎn)錄本數(shù)目也不會變化太多本冲。

對reads抽樣,觀察不同測序數(shù)據(jù)量情況下檢測到的基因數(shù)目的分布劫扒,并繪制如下曲線

如果曲線末端區(qū)域平滑檬洞,說明測序接近飽和,再增加測序量沟饥,檢測到的基因數(shù)目也不會變化太多添怔。

網(wǎng)頁提供了一個簡單直觀的查看結(jié)果的方式,但是很多細(xì)節(jié)還是需要到對應(yīng)的文件中進(jìn)行查找贤旷。網(wǎng)頁中summary部分的結(jié)果保存在metrics_summary.csv文件中广料,analysis部分結(jié)果保存在名為analysis的文件夾下,該文件夾包含以下4個子目錄

├── clustering
├── diffexp
├── pca
└── tsne

pca是表達(dá)量的PCA分析結(jié)果幼驶,tsne是表達(dá)來量的t-SNE分析結(jié)果艾杏,diffexp是差異分析的結(jié)果,clustering是聚類的結(jié)果盅藻,每個聚類結(jié)果都提供了一個cluster.csv文件购桑,內(nèi)容示意如下

可以看到barcode和cluster的對應(yīng)關(guān)系畅铭,barcode用于標(biāo)識細(xì)胞,這張表格反映的是細(xì)胞和cluster的對應(yīng)關(guān)系勃蜘。
在結(jié)果目錄硕噩,可以看到如下兩個目錄

  1. raw_feature_bc_matrix

  2. filtered_gene_bc_matrices


這兩個目錄下的內(nèi)容是類似的,raw目錄下是所有的barcode信息元旬,包含了細(xì)胞相關(guān)的barcoed和背景barcode,而filter目錄下只包含細(xì)胞相關(guān)的barcode信息榴徐,內(nèi)容如下

├── barcodes.tsv
├── genes.tsv
└── matrix.mtx

后綴為mtx的文件記錄的就是基因的表達(dá)量信息守问,可以導(dǎo)入R或者python中查看匀归,也可以通過如下命令轉(zhuǎn)換為csv格式

cellranger mat2csv \
outs/filtered_gene_bc_matrices \
sample.count.csv

除了用MEX格式來存儲表達(dá)量數(shù)據(jù),還使用用HDF5的格式來記錄表達(dá)量信息耗帕,對應(yīng)以下兩個文件

  1. raw_feature_bc_matrix.h5

  2. filtered_feature_bc_matrix.h5


在輸出目錄下穆端,還包含以下幾個文件

  1. possorted_genome_bam.bam

  2. possorted_genome_bam.bam.bai

  3. molecule_info.h5

  4. cloupe.cloupe


前兩個是比對產(chǎn)生的bam文件和索引,第三個文件是實驗相關(guān)的文庫仿便,GEM体啰,barcode表達(dá)量等信息的HDF5格式的文件,cloupe文件則是Loupe Cell Browser的輸入文件嗽仪,該軟件是官方提供的專門用于查看數(shù)據(jù)分析結(jié)果的軟件, 后續(xù)會介紹該軟件的使用荒勇。

·end·

—如果喜歡,快分享給你的朋友們吧—


掃描關(guān)注微信號闻坚,更多精彩內(nèi)容等著你沽翔!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市窿凤,隨后出現(xiàn)的幾起案子仅偎,更是在濱河造成了極大的恐慌,老刑警劉巖雳殊,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件橘沥,死亡現(xiàn)場離奇詭異,居然都是意外死亡夯秃,警方通過查閱死者的電腦和手機(jī)座咆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來仓洼,“玉大人,你說我怎么就攤上這事衬潦〗锫” “怎么了?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵镀岛,是天一觀的道長弦牡。 經(jīng)常有香客問我友驮,道長,這世上最難降的妖魔是什么驾锰? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任卸留,我火速辦了婚禮,結(jié)果婚禮上椭豫,老公的妹妹穿的比我還像新娘耻瑟。我一直安慰自己,他們只是感情好赏酥,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布喳整。 她就那樣靜靜地躺著,像睡著了一般裸扶。 火紅的嫁衣襯著肌膚如雪框都。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天呵晨,我揣著相機(jī)與錄音魏保,去河邊找鬼。 笑死摸屠,一個胖子當(dāng)著我的面吹牛谓罗,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播季二,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼檩咱,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了戒傻?” 一聲冷哼從身側(cè)響起税手,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎需纳,沒想到半個月后芦倒,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡不翩,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年兵扬,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片口蝠。...
    茶點(diǎn)故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡器钟,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出妙蔗,到底是詐尸還是另有隱情傲霸,我是刑警寧澤,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站昙啄,受9級特大地震影響穆役,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜梳凛,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一耿币、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧韧拒,春花似錦淹接、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至雇初,卻和暖如春拢肆,著一層夾襖步出監(jiān)牢的瞬間减响,已是汗流浹背靖诗。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留支示,地道東北人刊橘。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像颂鸿,于是被迫代替她去往敵國和親促绵。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容