單細(xì)胞實(shí)戰(zhàn)(2):cellranger使用

將SRA轉(zhuǎn)為fastq

數(shù)據(jù)下載好之后,我們得到的是SRR文件梳庆,需要將其轉(zhuǎn)換為fastq格式才能使用

wkd=/home/project/single-cell/MCC

cat SRR_Acc_List-2586-4.txt |while read i
do
fastq-dump --gzip --split-files ${i}.sra
done

結(jié)束之后每個(gè)SRR文件會(huì)變成解壓出三個(gè)文件

為什么會(huì)有三個(gè)文件,這個(gè)需要去查一下10X的官方說(shuō)明

可以看到Read1是26bp卑惜,主要是16bp的barcode和10bp的UMI膏执,Read2的長(zhǎng)度不固定,所以不一定是98bp露久,視情況而定更米,還有一個(gè)I7 index長(zhǎng)度是8bp

接下來(lái)就按照10X的標(biāo)準(zhǔn)去對(duì)文件進(jìn)行改名

cat SRR_Acc_List-9245-3.txt | while read i 
do 
mv ${i}_1*.gz${i}_S1_L001_I1_001.fastq.gz
mv ${i}_2*.gz ${i}_S1_L001_R1_001.fastq.gz
mv ${i}_3*.gz ${i}_S1_L001_R2_001.fastq.gz
done

之后我創(chuàng)建了文件夾將每個(gè)SRR數(shù)據(jù)的三個(gè)fastq文件放到一個(gè)文件夾下

SRR7722937
├── SRR7722937_S1_L001_I1_001.fastq.gz
├── SRR7722937_S1_L001_R1_001.fastq.gz
└── SRR7722937_S1_L001_R2_001.fastq.gz

cellranger使用

下載cellranger3.1版本(目前cellranger已經(jīng)支持4.0版本)并添加至環(huán)境變量

curl -o cellranger-3.1.0.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-3.1.0.tar.gz?Expires=1601922176&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1leHAvY2VsbHJhbmdlci0zLjEuMC50YXIuZ3oiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2MDE5MjIxNzZ9fX1dfQ__&Signature=mCC-emSQTqWg3i6Rm23lkuccNRI4z7xf-8bJ-O5gHqsYFJHDPZN9MeUZW5vhRZvmZhiGK7EDL4y~3xPtQbS6JtfUL9EFsoUxMywyF7tGN2ZlU2pbb2EVpmhKjmDWPVmvurDb~ZlHVYZCYcOc6gEHVtFRre-ICa7-nccVtnUJA-HvxNrZMs5mlQaUG9E-ngtbLi86gvIYlMHYnFRieZYpMA-kmUKrHGG8MhiuBGR96AWOrsVdTyMjD-BJOurGYvZGddWAF5uVXNPJs47FqF4fNCSQw71WOSRx4bQGdfb-jrOFp-NDSYFhkY1-gigku8VCx9phFCtyTAVM9yHeGN1oMQ__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"
tar -zxvf cellranger-3.1.0.tar.gz
export PATH=/datadisk02/ScRNAseq/cellranger-3.1.0:$PATH

構(gòu)建注釋

wget ftp://ftp.ensembl.org/pub/release-93/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
gunzip Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz


wget ftp://ftp.ensembl.org/pub/release-93/gtf/homo_sapiens/Homo_sapiens.GRCh38.93.gtf.gz
gunzip Homo_sapiens.GRCh38.93.gtf.gz


cellranger mkgtf Homo_sapiens.GRCh38.93.gtf Homo_sapiens.GRCh38.93.filtered.gtf \
                 --attribute=gene_biotype:protein_coding \
                 --attribute=gene_biotype:lincRNA \
                 --attribute=gene_biotype:antisense \
                 --attribute=gene_biotype:IG_LV_gene \
                 --attribute=gene_biotype:IG_V_gene \
                 --attribute=gene_biotype:IG_V_pseudogene \
                 --attribute=gene_biotype:IG_D_gene \
                 --attribute=gene_biotype:IG_J_gene \
                 --attribute=gene_biotype:IG_J_pseudogene \
                 --attribute=gene_biotype:IG_C_gene \
                 --attribute=gene_biotype:IG_C_pseudogene \
                 --attribute=gene_biotype:TR_V_gene \
                 --attribute=gene_biotype:TR_V_pseudogene \
                 --attribute=gene_biotype:TR_D_gene \
                 --attribute=gene_biotype:TR_J_gene \
                 --attribute=gene_biotype:TR_J_pseudogene \
                 --attribute=gene_biotype:TR_C_gene


cellranger mkref --genome=GRCh38 \
                 --fasta=Homo_sapiens.GRCh38.dna.primary_assembly.fa \
                 --genes=Homo_sapiens.GRCh38.93.filtered.gtf \
                 --ref-version=3.0.0
                

也可以下載構(gòu)建好的注釋

curl -O https://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-GRCh38-3.0.0.tar.gz

然后進(jìn)行比對(duì)即可

cellranger count --id=SRR937 --transcriptome=GRCh38 --fastqs=SRR7722937/ --sample=SRR7722937

在分析過(guò)程中可以發(fā)現(xiàn)有些命令比較眼熟,不難發(fā)現(xiàn)cellranger的比對(duì)還是構(gòu)建索引其實(shí)都有STAR的影子毫痕,后續(xù)的話我將STARsolo(利用STAR分析單細(xì)胞數(shù)據(jù))的流程再整理一下征峦。

Generating STAR genome index (may take over 8 core hours for a 3Gb genome)...
15:12:38 ..... Started STAR run
15:12:38 ... Starting to generate Genome files
15:14:31 ... starting to sort  Suffix Array. This may take a long time...
15:14:41 ... sorting Suffix Array chunks and saving them to disk...

參考鏈接

https://support.10xgenomics.com/single-cell-gene-expression/software/release-notes/build#grch38_3.0.0

10x_Technical_Note_Base_Composition_SC3_v2_RevB.pdf

【生信技能樹】使用10X單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)探索免疫治療

單細(xì)胞實(shí)戰(zhàn)(三) Cell Ranger使用初探

單細(xì)胞實(shí)戰(zhàn)(二) cell ranger使用前注意事項(xiàng)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市消请,隨后出現(xiàn)的幾起案子栏笆,更是在濱河造成了極大的恐慌,老刑警劉巖臊泰,帶你破解...
    沈念sama閱讀 216,324評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蛉加,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡缸逃,警方通過(guò)查閱死者的電腦和手機(jī)针饥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)需频,“玉大人打厘,你說(shuō)我怎么就攤上這事『爻剑” “怎么了户盯?”我有些...
    開封第一講書人閱讀 162,328評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)饲化。 經(jīng)常有香客問(wèn)我莽鸭,道長(zhǎng),這世上最難降的妖魔是什么吃靠? 我笑而不...
    開封第一講書人閱讀 58,147評(píng)論 1 292
  • 正文 為了忘掉前任硫眨,我火速辦了婚禮,結(jié)果婚禮上巢块,老公的妹妹穿的比我還像新娘礁阁。我一直安慰自己巧号,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評(píng)論 6 388
  • 文/花漫 我一把揭開白布姥闭。 她就那樣靜靜地躺著丹鸿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪棚品。 梳的紋絲不亂的頭發(fā)上靠欢,一...
    開封第一講書人閱讀 51,115評(píng)論 1 296
  • 那天,我揣著相機(jī)與錄音铜跑,去河邊找鬼门怪。 笑死,一個(gè)胖子當(dāng)著我的面吹牛锅纺,可吹牛的內(nèi)容都是我干的掷空。 我是一名探鬼主播,決...
    沈念sama閱讀 40,025評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼囤锉,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼坦弟!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起嚼锄,我...
    開封第一講書人閱讀 38,867評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤减拭,失蹤者是張志新(化名)和其女友劉穎蔽豺,沒想到半個(gè)月后区丑,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,307評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡修陡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評(píng)論 2 332
  • 正文 我和宋清朗相戀三年沧侥,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片魄鸦。...
    茶點(diǎn)故事閱讀 39,688評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡宴杀,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出拾因,到底是詐尸還是另有隱情旺罢,我是刑警寧澤,帶...
    沈念sama閱讀 35,409評(píng)論 5 343
  • 正文 年R本政府宣布绢记,位于F島的核電站扁达,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏蠢熄。R本人自食惡果不足惜跪解,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望签孔。 院中可真熱鬧叉讥,春花似錦窘行、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至透绩,卻和暖如春翘骂,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背帚豪。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工碳竟, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人狸臣。 一個(gè)月前我還...
    沈念sama閱讀 47,685評(píng)論 2 368
  • 正文 我出身青樓莹桅,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親烛亦。 傳聞我的和親對(duì)象是個(gè)殘疾皇子诈泼,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評(píng)論 2 353