1.軟件和參考基因組文件下載
cellranger下載
建議下載比較新的的暗膜,我這個(gè)是因?yàn)橄牒驮谋3忠恢滤圆畔螺d的老版本
官網(wǎng)下載:https://www.10xgenomics.com/support/software/cell-ranger/downloads
cd ~/software/cellranger
wget -O cellranger-6.0.2.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-6.0.2.tar.gz?Expires=1724881187&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=HPfORTrF4M976zLUm~6mC08BoeC56ON8095j5s02yB-x1hRxFkIvhfBgMiRCYtrh1-s59agfNWPcS5Dc61joZCR-Cf72~ONizQ0ovhQgKz2lYt0nPZhsVeJEW2SN0gReUMPPNASu4YH851-E~FqNxaj34jzic7Wq90rMt-yr-No-5iOEZwPeNIUeVQ2qQ-nRId7q4QEVRLymDqhJn6RtPsU~e6addCfkiZZSemhCpzxiYOCmHztLaNQbkzemD8vSPmAjgvHWbwX5HPuuXcehhI3~Fr0KHWNkSa06e4MN0H-IQ6SpqqHJeERcIEu~5P6JlWLG0Vg5TN6gBkVNHySn5w__"
tar -xzvf cellranger-6.0.2.tar.gz
參考基因組下載
Human hg38
# hg38
curl -O https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-2020-A.tar.gz
# mm10
curl -O https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-mm10-2020-A.tar.gz)
# hg38 & mm10
curl -O https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-and-mm10-2020-A.tar.gz
Virus (以SASR1為例)
在該文章中SASR1對應(yīng)的annotation是NC_004718.3
病毒參考文件需要準(zhǔn)備:基因組的DNA序列文件(FASTA格式)& 基因的注釋文件(GTF格式)尸折。常用的Ensembl和NCBI數(shù)據(jù)庫都提供了這兩種格式的文件。
以NCBI下載病毒參考文件
- NCBI 輸入accession--點(diǎn)擊標(biāo)題進(jìn)入--分別按照下圖參數(shù)下載對應(yīng) .fasta 和 .gff3 文件
修改下名稱便于后續(xù)分析:NC_004718.3.fa NC_004718.3.gff3
- gff3 文件后續(xù)用代碼轉(zhuǎn)換為 .gtf 文件
使用gffread包轉(zhuǎn)換格式
cd ~/software/cellranger/files/
gffread NC_004718.3.gff3 -T -o NC_004718.3.gtf
轉(zhuǎn)換后的原始GTF文件可以看到包含三種類型悉稠,但是由于cellranger makrdf只識別exon所以需要再進(jìn)行修改,只保留transcript所在的行,并把"transcript"替換為"exon"即可粘都。(有些unknown的行可以手動(dòng)刪除)
注意!GTF文件具有其特定格式胯杭,改動(dòng)過程要注意不要改變其原本格式驯杜,定量過程中最關(guān)鍵的是第9列要包含"transcript_id"和"gene_id"受啥,"gene_name"最好也保留做个。
構(gòu)建人類和病毒的混合參考基因組
合并文件
分別合并.fa .gtf文件
cd ~/software/cellranger/files/
cat GRCh38-2020-A.fa NC_004718.3.fa > SARS1_GRCh38-2020-A.fa
cat GRCh38-2020-A.gtf NC_004718.3.gtf > SARS1_GRCh38-2020-A.gtf
#通過檢測各文件行數(shù)進(jìn)行 check
grep -c ">" SARS1_GRCh38-2020-A.fa # 195
grep -c ">" GRCh38-2020-A.fa # 194
wc -l SARS1_GRCh38-2020-A.gtf # 2765999
wc -l GRCh38-2020-A.gtf # 2765974
構(gòu)建參考文件
這里使用特定的cellranger版本(v6.0.2)來進(jìn)行構(gòu)建
cd ~/software/cellranger/files/
/home/chencx/software/cellranger/cellranger-6.0.2/cellranger mkref --genome=SARS1_GRCh38-2020-A \
--fasta=SARS1_GRCh38-2020-A.fa \
--genes=SARS1_GRCh38-2020-A.gtf
構(gòu)建后的文件如下圖所示
參考基因組定量
使用cellranger count進(jìn)行定量分析
--transcriptome
指定構(gòu)建的新文件夾
/home/chencx/software/cellranger/cellranger-6.0.2/cellranger count --id=SARS1 \
--transcriptome=/home/chencx/software/cellranger/files/SARS1_GRCh38-2020-A \
--fastqs=/file_path/primary_seq/SARS1 \
--sample=SARS1 \
--localcores=10 \
--localmem=200
結(jié)果
查看目標(biāo)基因表達(dá)
歡迎大家評論交流!
(每帖分享:我身體里的火車從來不會(huì)錯(cuò)軌滚局,所以接受大雪居暖,風(fēng)暴,泥石流和荒謬)