10x genomics RNAseq數(shù)據(jù)分析實(shí)戰(zhàn)

10x數(shù)據(jù)類型:

10x數(shù)據(jù)類型

每個(gè)樣本測出3個(gè)fastq,通過I1,R1,R2來區(qū)別厌小,
下載安裝cellranger闲礼,
下載所需要的reference,

(一)跑cellranger count

/home/XXX/software/biosoftware/cellranger-2.2.0/cellranger count \
--id=ID24 \
--fastqs=/path/data/20180810_10x/10x/   \
--sample=WBJPE18018647-1_HMVMKCCXY_L6_WBJPE18018647_20180729_P,WBJPE18018647-2_HMVMKCCXY_L6_WBJPE18018647_20180729_P,WBJPE18018647-3_HMVMKCCXY_L6_WBJPE18018647_20180729_P,WBJPE18018647-4_HMVMKCCXY_L6_WBJPE18018647_20180729_P,WBJPE18018648-1_HMVMKCCXY_L7_WBJPE18018648_20180729_P,WBJPE18018648-2_HMVMKCCXY_L7_WBJPE18018648_20180729_P,WBJPE18018648-3_HMVMKCCXY_L7_WBJPE18018648_20180729_P,WBJPE18018648-4_HMVMKCCXY_L7_WBJPE18018648_20180729_P  \
--transcriptome=/home/XXX/database/refdata-cellranger-GRCh38-1.2.0

8個(gè)樣本龟梦,數(shù)據(jù)量約132G,耗時(shí)38小時(shí)窃躲,線程20個(gè)计贰,內(nèi)存128G。
最后得到的結(jié)果在outs目錄下

Outputs:
- Run summary HTML:                      /path/data/20180810_10x/work/L006/outs/web_summary.html
- Run summary CSV:                       /path/data/20180810_10x/work/L006/outs/metrics_summary.csv
- BAM:                                   /path/data/20180810_10x/work/L006/outs/possorted_genome_bam.bam
- BAM index:                             /path/data/20180810_10x/work/L006/outs/possorted_genome_bam.bam.bai
- Filtered gene-barcode matrices MEX:    /path/data/20180810_10x/work/L006/outs/filtered_gene_bc_matrices
- Filtered gene-barcode matrices HDF5:   /path/data/20180810_10x/work/L006/outs/filtered_gene_bc_matrices_h5.h5
- Unfiltered gene-barcode matrices MEX:  /path/data/20180810_10x/work/L006/outs/raw_gene_bc_matrices
- Unfiltered gene-barcode matrices HDF5: /path/data/20180810_10x/work/L006/outs/raw_gene_bc_matrices_h5.h5
- Secondary analysis output CSV:         /path/data/20180810_10x/work/L006/outs/analysis
- Per-molecule read information:         /path/data/20180810_10x/work/L006/outs/molecule_info.h5
- Loupe Cell Browser file:               /path/data/20180810_10x/work/L006/outs/cloupe.cloupe

2018-08-29 03:45:03 [perform] Serializing pipestance performance data.
Waiting 6 seconds for UI to do final refresh.
Pipestance completed successfully!

(二)用dropEst軟件跑10x 數(shù)據(jù)

1蒂窒,創(chuàng)建目錄及配置文件

mkdir -p 01_dropTag 02_alignment 03_dropEst
sh pipeline.sh \
/home/XXX/software/biosoftware/dropEst/build  \ # dropest軟件路徑
/path/work/02.dropEst/10x.test.xml \ # 配置文件
/path/work/02.dropEst/star \ # star的索引路徑
/home/XXX/database/refdata-cellranger-GRCh38-1.2.0/genes/genes.gtf  # gtf文件路徑

配置文件xml如下:

<config>
    <!-- droptag -->
    <TagsSearch>
        <protocol>10x</protocol>
        <BarcodesSearch>
            <barcode1_length>8</barcode1_length>
            <barcode2_length>16</barcode2_length>
            <umi_length>10</umi_length>
            <r1_rc_length>0</r1_rc_length>
        </BarcodesSearch>

        <Processing>
            <min_align_length>10</min_align_length>
            <reads_per_out_file>10000000</reads_per_out_file>
            <poly_a_tail>AAAAAAAA</poly_a_tail>
        </Processing>
    </TagsSearch>

    <!-- dropest -->
    <Estimation>
        <Merge>
            <barcodes_file>/home/XXX/software/biosoftware/dropEst/data/barcodes/10x_aug_2016_split</barcodes_file>
            <barcodes_type>const</barcodes_type>
            <min_merge_fraction>0.2</min_merge_fraction>
            <max_cb_merge_edit_distance>2</max_cb_merge_edit_distance>
            <max_umi_merge_edit_distance>1</max_umi_merge_edit_distance>
            <min_genes_after_merge>100</min_genes_after_merge>
            <min_genes_before_merge>20</min_genes_before_merge>
        </Merge>

        <PreciseMerge>
            <max_merge_prob>1e-5</max_merge_prob>
            <max_real_merge_prob>1e-7</max_real_merge_prob>
        </PreciseMerge>
    </Estimation>
</config>

這里的pipeline.sh如下:

$ cat pipeline.sh
if [ "$#" -ne 4 ]; then
    echo "usage: $0 dropest_directory config_file star_index_folder gtf_with_genes"
    echo "example: $0 ~/dropEst/build ~/dropEst/configs/indrop_v3.xml ~/star/mm10/index/ ~/star/mm10/genes.gtf"
    exit 1
fi

dropest_dir=$1
config_file=$2
star_index=$3
gtf_file=$4
cd 01_dropTag
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample1 -l sample1 /path/work/02.dropEst/data/WBJPE18018647-1_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S1_L006_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-1_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S1_L006_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-1_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S1_L006_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample2 -l sample2 /path/work/02.dropEst/data/WBJPE18018647-2_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S2_L006_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-2_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S2_L006_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-2_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S2_L006_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample3 -l sample3 /path/work/02.dropEst/data/WBJPE18018647-3_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S3_L006_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-3_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S3_L006_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-3_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S3_L006_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample4 -l sample4 /path/work/02.dropEst/data/WBJPE18018647-4_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S4_L006_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-4_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S4_L006_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018647-4_HMVMKCCXY_L6_WBJPE18018647_20180729_P_S4_L006_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample5 -l sample5 /path/work/02.dropEst/data/WBJPE18018648-1_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S5_L007_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-1_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S5_L007_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-1_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S5_L007_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample6 -l sample6 /path/work/02.dropEst/data/WBJPE18018648-2_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S6_L007_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-2_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S6_L007_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-2_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S6_L007_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample7 -l sample7 /path/work/02.dropEst/data/WBJPE18018648-3_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S7_L007_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-3_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S7_L007_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-3_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S7_L007_R2_001.fastq.gz
$dropest_dir/droptag -c $config_file -r 0 -p 20 -S -s -n sample8 -l sample8 /path/work/02.dropEst/data/WBJPE18018648-4_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S8_L007_I1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-4_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S8_L007_R1_001.fastq.gz /path/work/02.dropEst/data/WBJPE18018648-4_HMVMKCCXY_L7_WBJPE18018648_20180729_P_S8_L007_R2_001.fastq.gz

cd ../02_alignment
STAR --runThreadN 20 --genomeDir $star_index --readFilesCommand zcat --outSAMtype BAM Unsorted --readFilesIn /path/work/02.dropEst/01_dropTag/sample1.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample2.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample3.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample4.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample5.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample6.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample7.fastq.gz.tagged.fastq.gz,/path/work/02.dropEst/01_dropTag/sample8.fastq.gz.tagged.fastq.gz

cd ../03_dropEst
# $dropest_dir/dropest -w -M -u -G 20 -g $gtf_file -c $config_file ../02_alignment/Aligned.out.bam
$dropest_dir/dropest -w -m -r "/path/work/02.dropEst/01_dropTag/sample8.params.gz /path/work/02.dropEst/01_dropTag/sample7.params.gz /path/work/02.dropEst/01_dropTag/sample6.params.gz /path/work/02.dropEst/01_dropTag/sample5.params.gz /path/work/02.dropEst/01_dropTag/sample4.params.gz /path/work/02.dropEst/01_dropTag/sample3.params.gz /path/work/02.dropEst/01_dropTag/sample2.params.gz /path/work/02.dropEst/01_dropTag/sample1.params.gz"  -g $gtf_file -c $config_file ../02_alignment/Aligned.out.bam

分步去跑第一步躁倒,droptag,然后將8個(gè)樣本的結(jié)果合并起來洒琢,用于第二步的比對秧秉,再跑第三步的dropest。
第三步dropest報(bào)錯(cuò):內(nèi)存超了128G衰抑,因?yàn)槲曳?wù)器的運(yùn)行內(nèi)存只有128G象迎,轉(zhuǎn)到天河超算中跑。

(三)用zUMIs軟件跑10x數(shù)據(jù)

(四)比較呛踊,同一份數(shù)據(jù)用不同的軟件得出的結(jié)果比較

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末砾淌,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子谭网,更是在濱河造成了極大的恐慌汪厨,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,378評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件愉择,死亡現(xiàn)場離奇詭異劫乱,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)锥涕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,970評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門衷戈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人层坠,你說我怎么就攤上這事殖妇。” “怎么了窿春?”我有些...
    開封第一講書人閱讀 168,983評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵拉一,是天一觀的道長。 經(jīng)常有香客問我旧乞,道長蔚润,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,938評(píng)論 1 299
  • 正文 為了忘掉前任尺栖,我火速辦了婚禮嫡纠,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘延赌。我一直安慰自己除盏,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,955評(píng)論 6 398
  • 文/花漫 我一把揭開白布挫以。 她就那樣靜靜地躺著者蠕,像睡著了一般。 火紅的嫁衣襯著肌膚如雪掐松。 梳的紋絲不亂的頭發(fā)上踱侣,一...
    開封第一講書人閱讀 52,549評(píng)論 1 312
  • 那天,我揣著相機(jī)與錄音大磺,去河邊找鬼抡句。 笑死,一個(gè)胖子當(dāng)著我的面吹牛杠愧,可吹牛的內(nèi)容都是我干的待榔。 我是一名探鬼主播,決...
    沈念sama閱讀 41,063評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼流济,長吁一口氣:“原來是場噩夢啊……” “哼锐锣!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起袭灯,我...
    開封第一講書人閱讀 39,991評(píng)論 0 277
  • 序言:老撾萬榮一對情侶失蹤刺下,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后稽荧,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體橘茉,經(jīng)...
    沈念sama閱讀 46,522評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,604評(píng)論 3 342
  • 正文 我和宋清朗相戀三年姨丈,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了畅卓。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,742評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蟋恬,死狀恐怖翁潘,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情歼争,我是刑警寧澤拜马,帶...
    沈念sama閱讀 36,413評(píng)論 5 351
  • 正文 年R本政府宣布渗勘,位于F島的核電站,受9級(jí)特大地震影響俩莽,放射性物質(zhì)發(fā)生泄漏旺坠。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,094評(píng)論 3 335
  • 文/蒙蒙 一扮超、第九天 我趴在偏房一處隱蔽的房頂上張望取刃。 院中可真熱鬧,春花似錦出刷、人聲如沸璧疗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,572評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽崩侠。三九已至,卻和暖如春坷檩,著一層夾襖步出監(jiān)牢的瞬間啦膜,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,671評(píng)論 1 274
  • 我被黑心中介騙來泰國打工淌喻, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留僧家,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,159評(píng)論 3 378
  • 正文 我出身青樓裸删,卻偏偏與公主長得像八拱,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子涯塔,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,747評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容