單細(xì)胞大多數(shù)東西我都不是那么想寫(xiě)辙纬,因?yàn)榫褪钦罩鞒坛6覍?xiě)的人挺多的了难捌,不差我一個(gè)。但是最近谷歌了一下cellranger multi的中文教程鸦难,都沒(méi)有讓我滿意的根吁,就寫(xiě)一個(gè)吧。
至于怎么下載單細(xì)胞的參考基因組這些就不寫(xiě)了合蔽,至于為什么要用multi婴栽,因?yàn)閂DJ如果能夠有單細(xì)胞轉(zhuǎn)錄組的改變作為參考會(huì)更加準(zhǔn)確
該 cellranger multi通過(guò)丟棄在相應(yīng)的5’基因表達(dá)數(shù)據(jù)集中未被調(diào)用的任何細(xì)胞來(lái)改進(jìn) V (D) J 數(shù)據(jù)集中的細(xì)胞調(diào)用。通過(guò)將在 V (D) J 結(jié)果中調(diào)用但不在5’基因表達(dá)結(jié)果中調(diào)用的細(xì)胞分配為 V (D) J 數(shù)據(jù)中的背景 GEM辈末,cellranger multi減輕了 BCR 和 TCR 數(shù)據(jù)中可能出現(xiàn)的過(guò)度calling問(wèn)題。這種改進(jìn)的細(xì)胞calling只有在5’基因表達(dá)和 V (D) J 文庫(kù)從同一個(gè)樣品測(cè)序時(shí)才可能(所以同一批測(cè)了單細(xì)胞轉(zhuǎn)錄組和TCR映皆,BCR的才用它)挤聘。
主要參數(shù)
cellranger multi -h
cellranger-multi
Analyze multiplexed data or combined gene expression/immune profiling/feature barcode data
USAGE:
cellranger multi [OPTIONS] --id <ID> --csv <CSV>
OPTIONS:
--id <ID> A unique run id and output folder name [a-zA-Z0-9_-]+
--description <TEXT> Sample description to embed in output files [default: ]
--csv <CSV> Path of CSV file enumerating input libraries and analysis parameters
--dry Do not execute the pipeline. Generate a pipeline invocation (.mro) file and stop
--jobmode <MODE> Job manager to use. Valid options: local (default), sge, lsf, slurm or path to a .template file. Search for help on "Cluster Mode" at
support.10xgenomics.com for more details on configuring the pipeline to use a compute cluster [default: local]
--localcores <NUM> Set max cores the pipeline may request at one time. Only applies to local jobs
--localmem <NUM> Set max GB the pipeline may request at one time. Only applies to local jobs
--localvmem <NUM> Set max virtual address space in GB for the pipeline. Only applies to local jobs
--mempercore <NUM> Reserve enough threads for each job to ensure enough memory will be available, assuming each core on your cluster has at least this much
memory available. Only applies to cluster jobmodes
--maxjobs <NUM> Set max jobs submitted to cluster at one time. Only applies to cluster jobmodes
--jobinterval <NUM> Set delay between submitting jobs to cluster, in ms. Only applies to cluster jobmodes
--overrides <PATH> The path to a JSON file that specifies stage-level overrides for cores and memory. Finer-grained than --localcores, --mempercore and
--localmem. Consult https://support.10xgenomics.com/ for an example override file
--uiport <PORT> Serve web UI at http://localhost:PORT
--disable-ui Do not serve the web UI
--noexit Keep web UI running after pipestance completes or fails
--nopreflight Skip preflight checks
-h, --help Print help information
基本的使用就是
如果需要改內(nèi)存和線程,按照上面改就是了
cellranger multi --id <ID> --csv <CSV>
含有VDJ和基因表達(dá)測(cè)序一起跑
構(gòu)建一個(gè)csv文件捅彻,內(nèi)容就是這些组去,備注已經(jīng)寫(xiě)的比較傻瓜化了,其他參數(shù)參考最后一個(gè)鏈接
[gene-expression] ### 不用動(dòng)
reference,/path/to/transcriptome ### reference不用動(dòng)步淹,后面寫(xiě)自己的轉(zhuǎn)錄參考基因組的路徑
[vdj] ### 不用動(dòng)
reference,/path/to/vdj_reference ### reference不用動(dòng)从隆,后面寫(xiě)自己的VDJ參考基因組的路徑
[feature] ### Antibody Capture or CRISPR Guide Capture libraries才會(huì)需要這個(gè)诚撵,單細(xì)胞轉(zhuǎn)錄組和VDJ不需要,可以刪掉
reference,/path/to/feature_ref.csv
[libraries] ### 不用動(dòng)
fastq_id,fastqs,lanes,feature_types,subsample_rate ### 按照需要键闺,但是這行基本不用動(dòng)
GEX_fastqs_id,path/to/GEX_fastqs,1|2,Gene Expression, ### 改樣本名字和路徑寿烟,其他不用動(dòng)
VDJ_B_fastqs_id,path/to/vdj_B_fastqs,1|2,VDJ-B,### 改樣本名字和路徑,其他不用動(dòng)
VDJ_T_fastqs_id,path/to/vdj_T_fastqs,1|2,VDJ-T,### 改樣本名字和路徑辛燥,其他不用動(dòng)
FB_fastqs_id,path/to/FB_fastqs,1|2,Antibody Capture, ### 如果沒(méi)有筛武,刪掉
CRISPR_fastqs_id,path/to/CRISPR_fastqs,1|2,CRISPR Guide Capture, ### 如果沒(méi)有,刪掉
這個(gè)主要針對(duì)3端的10X多個(gè)樣本測(cè)序挎塌,但是也可以告訴你上述的參數(shù)內(nèi)涵是什么(估計(jì)是老版本的主要功能徘六,但是新版里也沒(méi)有拋棄它)
Cell Multiplexing with cellranger multi -Software -Single Cell Gene Expression -Official 10x Genomics Support
這個(gè)文檔里面告訴你上面這個(gè)csv的參數(shù)內(nèi)涵是什么?(單細(xì)胞轉(zhuǎn)錄組加VDJ看這個(gè))
Gene Expression, V(D)J & Feature Barcode Analysis with cellranger multi -Software -Single Cell Immune Profiling -Official 10x Genomics Support
產(chǎn)生的文件
outs/
├── config.csv
├── multi
│ ├── count
│ │ ├── raw_cloupe.cloupe
│ │ ├── raw_feature_bc_matrix
│ │ │ ├── barcodes.tsv.gz
│ │ │ ├── features.tsv.gz
│ │ │ └── matrix.mtx.gz
│ │ ├── raw_feature_bc_matrix.h5
│ │ ├── raw_molecule_info.h5
│ │ ├── unassigned_alignments.bam
│ │ └── unassigned_alignments.bam.bai
│ ├── vdj_b
│ │ ├── all_contig_annotations.bed
│ │ ├── all_contig_annotations.csv
│ │ ├── all_contig_annotations.json
│ │ ├── all_contig.bam
│ │ ├── all_contig.bam.bai
│ │ ├── all_contig.fasta
│ │ ├── all_contig.fasta.fai
│ │ └── all_contig.fastq
│ └── vdj_t
│ ├── all_contig_annotations.bed
│ ├── all_contig_annotations.csv
│ ├── all_contig_annotations.json
│ ├── all_contig.bam
│ ├── all_contig.bam.bai
│ ├── all_contig.fasta
│ ├── all_contig.fasta.fai
│ └── all_contig.fastq
├── per_sample_outs
│ └── Z6666
│ ├── count
│ │ ├── analysis
│ │ │ ├── clustering
│ │ │ │ ├── gene_expression_graphclust
│ │ │ │ │ └── clusters.csv
│ │ │ │ ├── gene_expression_kmeans_10_clusters
│ │ │ │ │ └── clusters.csv
│ │ │ │ ├── gene_expression_kmeans_2_clusters
│ │ │ │ │ └── clusters.csv
│ │ │ │ ├── gene_expression_kmeans_3_clusters
│ │ │ │ │ └── clusters.csv
│ │ │ │ ├── gene_expression_kmeans_4_clusters
│ │ │ │ │ └── clusters.csv
│ │ │ │ ├── gene_expression_kmeans_5_clusters
│ │ │ │ │ └── clusters.csv
│ │ │ │ ├── gene_expression_kmeans_6_clusters
│ │ │ │ │ └── clusters.csv
│ │ │ │ ├── gene_expression_kmeans_7_clusters
│ │ │ │ │ └── clusters.csv
│ │ │ │ ├── gene_expression_kmeans_8_clusters
│ │ │ │ │ └── clusters.csv
│ │ │ │ └── gene_expression_kmeans_9_clusters
│ │ │ │ └── clusters.csv
│ │ │ ├── diffexp
│ │ │ │ ├── gene_expression_graphclust
│ │ │ │ │ └── differential_expression.csv
│ │ │ │ ├── gene_expression_kmeans_10_clusters
│ │ │ │ │ └── differential_expression.csv
│ │ │ │ ├── gene_expression_kmeans_2_clusters
│ │ │ │ │ └── differential_expression.csv
│ │ │ │ ├── gene_expression_kmeans_3_clusters
│ │ │ │ │ └── differential_expression.csv
│ │ │ │ ├── gene_expression_kmeans_4_clusters
│ │ │ │ │ └── differential_expression.csv
│ │ │ │ ├── gene_expression_kmeans_5_clusters
│ │ │ │ │ └── differential_expression.csv
│ │ │ │ ├── gene_expression_kmeans_6_clusters
│ │ │ │ │ └── differential_expression.csv
│ │ │ │ ├── gene_expression_kmeans_7_clusters
│ │ │ │ │ └── differential_expression.csv
│ │ │ │ ├── gene_expression_kmeans_8_clusters
│ │ │ │ │ └── differential_expression.csv
│ │ │ │ └── gene_expression_kmeans_9_clusters
│ │ │ │ └── differential_expression.csv
│ │ │ ├── pca
│ │ │ │ └── gene_expression_10_components
│ │ │ │ ├── components.csv
│ │ │ │ ├── dispersion.csv
│ │ │ │ ├── features_selected.csv
│ │ │ │ ├── projection.csv
│ │ │ │ └── variance.csv
│ │ │ ├── tsne
│ │ │ │ └── gene_expression_2_components
│ │ │ │ └── projection.csv
│ │ │ └── umap
│ │ │ └── gene_expression_2_components
│ │ │ └── projection.csv
│ │ ├── sample_alignments.bam
│ │ ├── sample_alignments.bam.bai
│ │ ├── sample_cloupe.cloupe
│ │ ├── sample_filtered_barcodes.csv
│ │ ├── sample_filtered_feature_bc_matrix
│ │ │ ├── barcodes.tsv.gz
│ │ │ ├── features.tsv.gz
│ │ │ └── matrix.mtx.gz
│ │ ├── sample_filtered_feature_bc_matrix.h5
│ │ └── sample_molecule_info.h5
│ ├── metrics_summary.csv
│ ├── vdj_b
│ │ ├── airr_rearrangement.tsv
│ │ ├── cell_barcodes.json
│ │ ├── clonotypes.csv
│ │ ├── concat_ref.bam
│ │ ├── concat_ref.bam.bai
│ │ ├── concat_ref.fasta
│ │ ├── concat_ref.fasta.fai
│ │ ├── consensus_annotations.csv
│ │ ├── consensus.bam
│ │ ├── consensus.bam.bai
│ │ ├── consensus.fasta
│ │ ├── consensus.fasta.fai
│ │ ├── filtered_contig_annotations.csv
│ │ ├── filtered_contig.fasta
│ │ ├── filtered_contig.fastq
│ │ ├── vdj_contig_info.pb
│ │ └── vloupe.vloupe
│ ├── vdj_t
│ │ ├── airr_rearrangement.tsv
│ │ ├── cell_barcodes.json
│ │ ├── clonotypes.csv
│ │ ├── concat_ref.bam
│ │ ├── concat_ref.bam.bai
│ │ ├── concat_ref.fasta
│ │ ├── concat_ref.fasta.fai
│ │ ├── consensus_annotations.csv
│ │ ├── consensus.bam
│ │ ├── consensus.bam.bai
│ │ ├── consensus.fasta
│ │ ├── consensus.fasta.fai
│ │ ├── filtered_contig_annotations.csv
│ │ ├── filtered_contig.fasta
│ │ ├── filtered_contig.fastq
│ │ ├── vdj_contig_info.pb
│ │ └── vloupe.vloupe
│ └── web_summary.html
└── vdj_reference
├── fasta
│ ├── donor_regions.fa
│ └── regions.fa
└── reference.json