一文讀懂10X單細(xì)胞上游分析軟件cellranger

隨著單細(xì)胞研究越來越多,基于Single-Cell Sequencing發(fā)表的文章也越來越多更振,涉及領(lǐng)域涵蓋了腫瘤、發(fā)育饭尝、神經(jīng)科學(xué)肯腕、免疫等。如何從龐大測序數(shù)據(jù)中獲得單個(gè)細(xì)胞的表達(dá)譜成為數(shù)據(jù)解析的關(guān)鍵點(diǎn)芋肠。CellRanger是10x genomic公司專為單細(xì)胞轉(zhuǎn)錄組分析提供的分析軟件乎芳,可實(shí)現(xiàn)從Illumina原始數(shù)據(jù)(BCL或fastq格式)到文庫拆分,細(xì)胞拆分及定量帖池,pca奈惑,聚類以及可視化(t-SNE和UMAP)結(jié)果。該軟件高度集成化睡汹,即使您不會寫代碼也可以快速掌握其用法肴甸,使單細(xì)胞研究簡單化。

1

10x單細(xì)胞標(biāo)記原理

在講軟件用法之前囚巴,先給大家回顧下10x單細(xì)胞標(biāo)記原理(詳細(xì)信息可查看:10X Genomics單細(xì)胞轉(zhuǎn)錄組技術(shù)流程和優(yōu)勢)原在,Gel bead(下左圖)由凝膠珠和磁珠上的一段引物構(gòu)成友扰,引物序列構(gòu)成依次為:全長Illumina TruSeq Read 1 測序引物、16nt 10X Barcode序列(每個(gè)Gel bead的10X Barcode均不相同庶柿,形成GEM后用于區(qū)分細(xì)胞)村怪、12 nt unique molecular identifier (UMI) (區(qū)分同一細(xì)胞的不同轉(zhuǎn)錄本并去除PCR Duplications,實(shí)現(xiàn)絕對定量)浮庐、30 nt poly dT反轉(zhuǎn)錄引物甚负。最終形成的文庫結(jié)構(gòu)為下圖:

image
image
image

Tips:對于V2試劑(如5’轉(zhuǎn)錄組),10x Barcode-16nt审残,UMI-10nt(比V3試劑少2nt)梭域,10x Barcode+UMI=26nt

2

Cell Ranger軟件下載與安裝

1)該軟件的官方下載網(wǎng)址:

https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest 目前該軟件更新至3.1.0版本(2019-7-24),下載完成后(提醒:需要注冊并登陸才能下載)搅轿,直接解壓即可使用病涨,無需安裝,方便快捷璧坟。

image

2)對應(yīng)庫文件的下載

官方已經(jīng)提供了用于cellranger分析的了人(Human reference (GRCh38)及Human reference (hg19))既穆,小鼠(Mouse)及Human (hg19) and mouse 的reference。如果您的樣本來自這兩個(gè)物種建議直接下載用于后續(xù)的分析雀鹃,下載路徑同上循衰。如果您研究的對象不是人和小鼠,不用擔(dān)心褐澎,cellranger也有專門用于構(gòu)建reference的指令会钝。具體指令如下:

image

正常的輸出文件結(jié)構(gòu)如下:

image

Tips:如果您的基因組比較大,運(yùn)行該代碼時(shí)可能會報(bào)內(nèi)存的錯誤工三,添加參數(shù)--memgb進(jìn)行調(diào)整迁酸,該參數(shù)默認(rèn)16 (GB)。對于超大基因組(如小麥)俭正,染色體長度超過512M的基因組需要進(jìn)行拆分奸鬓,否則后續(xù)cellranger分析無法進(jìn)行下去。

3

Cell Ranger分析pipeline

cellranger mkfastq文庫拆分

Cell Ranger封裝了bcl2fastq軟件掸读,可以基于Illumina下機(jī)的原始數(shù)據(jù)(BCL格式)進(jìn)行數(shù)據(jù)拆分却邓,得到fastq數(shù)據(jù)薄料。一般情況下,GEO數(shù)據(jù)庫下載的數(shù)據(jù)或公司提供的數(shù)據(jù)基本上都是拆分后的fastq,因此這步可以不用運(yùn)行胰默。該模塊的原理及使用方法如下:

image
image

--id 由mkfastq創(chuàng)建的文件夾的名稱

--run Illumina BCL run文件夾路徑

--csv 包含lane夸政,sample和index的文件练慕,格式如下:

image

輸出文件結(jié)果如下:

image

Tips:由于10x測序數(shù)據(jù)量龐大贴浙,為了保證讀取的準(zhǔn)確性,每個(gè)10x sample_Index包含4個(gè)8堿基的引物(其中每個(gè)堿基位置上均包含了ATCG堿基)铛铁,樣本對應(yīng)的Index需仔細(xì)核對隔显。

cellranger count細(xì)胞及基因定量聚類等分析

count是cellranger軟件最重要核心的部分却妨,可以完成細(xì)胞鑒定,基因組比對括眠,基因定量彪标,細(xì)胞降維,聚類掷豺,差異分析等功能捐下。

image

--id 輸出結(jié)果文件夾

--tranome reference 所在文件夾

--fastqs 樣本對應(yīng)測序fastq 所在文件夾

--sample 樣本名,即mkfastq輸出的樣本名

Tips:--id參數(shù)不能寫絕對路徑萌业,因此如果需要輸出到指定路徑下,需要先通過cd到輸出結(jié)果路徑奸柬,fastq對應(yīng)的數(shù)據(jù)格式應(yīng)為:subject1_S1_L001_R1_001.fastq.gz生年,設(shè)置--sample=subject1,除這些參數(shù)外廓奕,還可以設(shè)置線程數(shù)和內(nèi)存以及reads長度抱婉,預(yù)計(jì)細(xì)胞數(shù),強(qiáng)制細(xì)胞數(shù)等參數(shù)桌粉,其他參數(shù)可在官方網(wǎng)站查看學(xué)習(xí)

輸出文件結(jié)果如下:

image

結(jié)果文件說明:

image

metrics_summary.csv 匯總指標(biāo)csv格式蒸绩,表格信息來自html中的summary部分

possorted_genome_bam.bam reads 比對基因組bam文件

filtered_feature_bc_matrix 過濾后的細(xì)胞和基因及對應(yīng)的定量信息

raw_feature_bc_matrix 原始的細(xì)胞和基因及對應(yīng)的定量信息

Analysis tsne,差異分析等二級分析相應(yīng)的輸出結(jié)果

molecule_info.h5 多樣本整合aggr分析輸入文件

cloupe.cloupe 配套軟件Loupe Cell Browser 輸入文件

Tips:cellranger count并不能對一些低質(zhì)量的細(xì)胞(比如線粒體表達(dá)高處于凋亡的細(xì)胞)以及可能包含多個(gè)細(xì)胞的結(jié)果進(jìn)行過濾铃肯。

cellranger aggr GEM文庫整合

當(dāng)實(shí)驗(yàn)中用到了多個(gè)GEM well患亿,需要整合分析時(shí),選擇該分析押逼,該分析是基于單個(gè)樣本cellranger count分析得到的molecule_info.h5步藕,進(jìn)一步整合分析的。分析得到的結(jié)果結(jié)構(gòu)與cellranger count結(jié)果結(jié)構(gòu)基本一致挑格,這里不再詳細(xì)介紹咙冗。

image

--id 輸出結(jié)果文件夾

--csv 樣本對應(yīng)cellranger count輸出結(jié)果文件,格式如下:

Tips:如果需要整合的樣本中既有用v2試劑又有用v3試劑的漂彤,在第三列加入相應(yīng)樣本對應(yīng)的試劑信息雾消,如果只用了一種試劑,只保留前兩列的信息即可挫望。

cellranger reanalyze

相比于count和aggr立润,reanalyze接受更多的可選的參數(shù),更進(jìn)一步分析媳板,相應(yīng)的分析指令及參數(shù)請參考:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/reanalyze
一文輕松玩轉(zhuǎn)10X單細(xì)胞轉(zhuǎn)錄組官方分析軟件CellRange | 單細(xì)胞專題_fastq (sohu.com)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末范删,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子拷肌,更是在濱河造成了極大的恐慌到旦,老刑警劉巖旨巷,帶你破解...
    沈念sama閱讀 206,723評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異添忘,居然都是意外死亡采呐,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評論 2 382
  • 文/潘曉璐 我一進(jìn)店門搁骑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來斧吐,“玉大人,你說我怎么就攤上這事仲器∶郝剩” “怎么了?”我有些...
    開封第一講書人閱讀 152,998評論 0 344
  • 文/不壞的土叔 我叫張陵乏冀,是天一觀的道長蝶糯。 經(jīng)常有香客問我,道長辆沦,這世上最難降的妖魔是什么昼捍? 我笑而不...
    開封第一講書人閱讀 55,323評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮肢扯,結(jié)果婚禮上妒茬,老公的妹妹穿的比我還像新娘。我一直安慰自己蔚晨,他們只是感情好乍钻,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,355評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著铭腕,像睡著了一般团赁。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上谨履,一...
    開封第一講書人閱讀 49,079評論 1 285
  • 那天欢摄,我揣著相機(jī)與錄音,去河邊找鬼笋粟。 笑死怀挠,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的害捕。 我是一名探鬼主播绿淋,決...
    沈念sama閱讀 38,389評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼尝盼!你這毒婦竟也來了吞滞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,019評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎裁赠,沒想到半個(gè)月后殿漠,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,519評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡佩捞,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,971評論 2 325
  • 正文 我和宋清朗相戀三年绞幌,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片一忱。...
    茶點(diǎn)故事閱讀 38,100評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡莲蜘,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出帘营,到底是詐尸還是另有隱情票渠,我是刑警寧澤,帶...
    沈念sama閱讀 33,738評論 4 324
  • 正文 年R本政府宣布芬迄,位于F島的核電站问顷,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏薯鼠。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,293評論 3 307
  • 文/蒙蒙 一械蹋、第九天 我趴在偏房一處隱蔽的房頂上張望出皇。 院中可真熱鬧,春花似錦哗戈、人聲如沸郊艘。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽纱注。三九已至,卻和暖如春胆胰,著一層夾襖步出監(jiān)牢的瞬間狞贱,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評論 1 262
  • 我被黑心中介騙來泰國打工蜀涨, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留瞎嬉,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,547評論 2 354
  • 正文 我出身青樓厚柳,卻偏偏與公主長得像氧枣,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子别垮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,834評論 2 345

推薦閱讀更多精彩內(nèi)容