OptiType只能分型HLA-A, HLA-B, HLA-C三種類型
文章2014年發(fā)表:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4441069/
截止2022年2月看到github上的版本:2020年9月更新到了v1.3.5
安裝:
mkdir OptiType
cd OptiType
tar -zxvf OptiType-1.3.5.tar.gz
可以分析dna數(shù)據(jù)(WES陶缺,WGS)帕识,也可以分析RNA數(shù)據(jù)(RNAseq)鳖粟,用--dna和--rna參數(shù)區(qū)分。
輸入為:fastq格式:
作者建議三步走:
1,使用razers3 比對原始數(shù)據(jù)(fastq/gz)到hla reference上(注意dna和rna的不同,reference放在data目錄下),得到一個(gè)fished bam
>razers3 -i 95 -m 1 -dr 0 -o fished_1.bam /path/to/OptiType/data/hla_reference_dna.fasta sample_1.fastq
2糟描,再用samtools bam2fq 將bam轉(zhuǎn)換為fastq格式
>samtools bam2fq fished_1.bam > sample_1_fished.fastq
3,再用optitype
>python /path/to/OptiTypePipeline.py -i sample_fished_1.fastq [sample_fished_2.fastq]
(--rna | --dna) [--beta BETA] [--enumerate N]
[-c CONFIG] [--verbose] --outdir /path/to/out_dir/
還要提前修改 config.ini文件哦册倒。
測試: DNA data (paired end):
python OptiTypePipeline.py -i ./test/exome/NA11995_SRR766010_1_fished.fastq ./test/exome/NA11995_SRR766010_2_fished.fastq --dna -v -o ./test/exome/
測試:RNA data()
python OptiTypePipeline.py -i ./test/rna/CRC_81_N_1_fished.fastq ./test/rna/CRC_81_N_2_fished.fastq --rna -v -o ./test/rna/
真實(shí)數(shù)據(jù)測試:PE
razers3 -i 95 -m 1 -dr 0 -o fished_1.bam /software/OptiType-1.3.5/data/hla_reference_dna.fasta 2022112_L1_1.fq.gz
razers3 -i 95 -m 1 -dr 0 -o fished_2.bam /software/OptiType-1.3.5/data/hla_reference_dna.fasta 2022112_L1_2.fq.gz
samtools bam2fq fished_1.bam > sample_1_fished.fastq
samtools bam2fq fished_2.bam > sample_2_fished.fastq
python3 /cygene/software/biosoftware/OptiType/OptiType-1.3.5/OptiTypePipeline.py -i sample_1_fished.fastq sample_2_fished.fastq --dna -v -o ./