2020-07-23 靶向捕獲測序數(shù)據(jù)分析記錄5

寫在前面:從7月16日開始到PICU輪轉(zhuǎn)浪腐,前天跟值了一個(gè)夜班矢沿,可能是新人比較旺的緣故豁生,從中午就開始收病人,一直忙到凌晨3點(diǎn)多育叁,昨天早上6點(diǎn)過就起來干活查完房開完醫(yī)囑芍殖,寫完病程就到11點(diǎn)多,感覺腦子已經(jīng)完全不夠用了,回到住處就開始補(bǔ)瞌睡隐锭。今天6點(diǎn)多就出門上班计贰,因?yàn)橐纫恍z查結(jié)果,然后只辦了1個(gè)出院躁倒,忙完所有的事情后就12點(diǎn)了,1點(diǎn)過去參加一個(gè)組會(huì)褐桌,然后2點(diǎn)多終于閑下來象迎,看看之前的結(jié)果。

查看bam轉(zhuǎn)換情況發(fā)現(xiàn)有部分樣本轉(zhuǎn)換過程出了未知錯(cuò)誤挖帘,沒有成功轉(zhuǎn)換拇舀,提取出這部分的樣本名重新構(gòu)建config1再來進(jìn)行轉(zhuǎn)換

#構(gòu)建config1
basename -a *bam.tmp.0000* >tmp
cat tmp| while read id; do sample=${id%%.hg38.sort*}; echo $sample; done >config1
#刪除殘余文件
rm -rf *.bam.tmp.0*
#激活小環(huán)境重新開始轉(zhuǎn)換
conda activate wes
nohup cat config1 | while read id ; do bam=~/CHD_pooling_seq/${id}.dedup.bam; if [ ! -f ~/project/0.bwa/ok.${id}_marked.status ]; then echo "start CrossMap for ${id}" `date`; python /root/miniconda3/envs/py3/bin/CrossMap.py bam ~/biosoft/liftover/hg19ToHg38.over.chain.gz ${bam} ~/project/0.bwa/${id}.hg38 1>~/project/0.bwa/${id}_log.mark 2>&1; if [ $? -eq 0 ]; then touch ~/project/0.bwa/ok.${id}_marked.status; fi; echo "end CrossMap for ${id}" `date`; fi; done &

同時(shí)進(jìn)行varient calling:

單個(gè)樣本calling的腳本wesFlow_multi_to_gvcf.sh

(base) root@1100150:~/project# vi wesFlow_multi_to_gvcf.sh
(base) root@1100150:~/project# cat wesFlow_multi_to_gvcf.sh
#!usr/bin/bash
# use $sample
# bash ~/project/wesFlow_multi_to_gvcf.sh $sample
# This is a wesflow for only one sample

samtools=samtools
GATK=~/biosoft/gatk-4.1.7.0/gatk

#references
ref=~/reference/genome/Homo_sapiens_assembly38.fasta
gatk_ref=~/reference/genome/Homo_sapiens_assembly38.fasta
gatk_bundle=~/annotation/variation/GATK

dbsnp=$gatk_bundle/dbsnp_146.hg38.vcf.gz
indel=$gatk_bundle/Mills_and_1000G_gold_standard.indels.hg38.vcf.gz
G1000=$gatk_bundle/1000G_phase1.snps.high_confidence.hg38.vcf.gz
hapmap=$gatk_bundle/hapmap_3.3.hg38.vcf.gz
omini=$gatk_bundle/1000G_omni2.5.hg38.vcf.gz
mills=$gatk_bundle/Mills_and_1000G_gold_standard.indels.hg38.vcf.gz

outdir=~/project

## outdir directory

if [ ! -d $outdir/0.bwa ]
then mkdir -p $outdir/0.bwa
fi

if [ ! -d $outdir/gatk ]
then mkdir -p $outdir/gatk
fi

## start the gatk analysis

## start the gatk analysis

## with one sample
time $GATK --java-options "-Xmx20G -Djava.io.tmpdir=./tmp" MarkDuplicates \
    -I $outdir/0.bwa/$sample.hg38.sorted.bam \
    -O $outdir/0.bwa/${sample}.sorted.marked.bam \
    -M $outdir/0.bwa/$sample.metrics \
    1>$outdir/0.bwa/${sample}_log.mark 2>&1 && echo "MarkDuplicates done!"

time $GATK --java-options "-Xmx20G -Djava.io.tmpdir=./tmp" FixMateInformation \
    -I $outdir/0.bwa/${sample}.sorted.marked.bam \
    -O $outdir/0.bwa/${sample}.sorted.marked.fixed.bam \
    -SO coordinate \
    1>$outdir/0.bwa/${sample}_log.fix 2>&1
## 86 minutes
time $GATK --java-options "-Xmx20G -Djava.io.tmpdir=./tmp"  BaseRecalibrator \
    -R $ref  \
    -I $outdir/0.bwa/${sample}.sorted.marked.fixed.bam  \
    --known-sites $snp \
    --known-sites $indel \
    --known-sites $1000G \
    -O $outdir/0.bwa/${sample}_recal.table \
    1>$outdir/0.bwa/${sample}_log.recal 2>&1 && echo "BaseRecalibrator done!"
## 45 minutes
time $GATK --java-options "-Xmx20G -Djava.io.tmpdir=./tmp"   ApplyBQSR \
    -R $ref  \
    -I $outdir/0.bwa/${sample}.sorted.marked.fixed.bam  \
    -bqsr $outdir/0.bwa/${sample}_recal.table \
    -O $outdir/0.bwa/${sample}.sorted.marked.fixed.bqsr.bam \
    1>$outdir/0.bwa/${sample}_log.ApplyBQSR  2>&1 && echo "ApplyBQSR done!"
## 449m for 16G data
time $GATK --java-options "-Xmx20G -Djava.io.tmpdir=./tmp" HaplotypeCaller \
    -R $ref  \
    -I $outdir/0.bwa/${sample}.sorted.marked.fixed.bqsr.bam \
    #--dbsnp $dbsnp \
    -O $outdir/gatk/${sample}.HC.vcf.gz \
    1>$outdir/0.bwa/${sample}_log.HC 2>&1 && echo "HaplotypeCaller done!"

time $samtools index $outdir/0.bwa/${sample}.sorted.marked.fixed.bqsr.bam && echo "** ${sample}.sorted.marked.fixed.bqsr.bam index done! **"

# VQSR
# first SNP mode 分別評(píng)估SNP和INDEL突變位點(diǎn)的質(zhì)量
# SNP mode
time $GATK VariantRecalibrator \
    -R $ref \
    -V $outdir/gatk/$sample.HC.vcf.gz \
    --max-gaussians 4 \
    -resource:hapmap,known=false,training=true,truth=true,prior=15.0 $hapmap \
    -resource:omini,known=false,training=true,truth=false,prior=12.0 $omini \
    -resource:1000G,known=false,training=true,truth=false,prior=10.0 $G1000 \
    -resource:snp,known=true,training=false,truth=false,prior=10.0 $dbsnp \
    -an DP -an QD -an SOR -an ReadPosRankSum -an MQRankSum \
    -mode SNP \
    --rscript-file $outdir/gatk/${sample}.HC.snps.plots.R \
    --tranches-file $outdir/gatk/${sample}.HC.snps.tranches \
    -O $outdir/gatk/${sample}.HC.snps.recal

time $GATK ApplyVQSR \
    -R $ref \
    -V $outdir/gatk/$sample.HC.vcf.gz \
    --truth-sensitivity-filter-level 99.0 \
    --tranches-file $outdir/gatk/$sample.HC.snps.tranches \
    --recal-file $outdir/gatk/$sample.HC.snps.recal \
    -mode SNP \
    -O $outdir/gatk/$sample.HC.snps.VQSR.vcf.gz && echo "** SNPs VQSR done **"

## Indel mode
time $GATK VariantRecalibrator \
    -R $ref \
    -V $outdir/gatk/$sample.HC.snps.VQSR.vcf.gz \
    --max-gaussians 6 \
    -resource:mills,known=false,training=true,truth=true,prior=15.0 $mills \
    -an QD -an MQ -an MQRankSum -an ReadPosRankSum -an FS -an SOR \
    -mode INDEL \
    --rscript-file $outdir/gatk/${sample}.HC.snps.indels.plots.R \
    --tranches-file $outdir/gatk/${sample}.HC.snps.indels.tranches \
    -O $outdir/gatk/${sample}.HC.snps.indels.recal

time $GATK ApplyVQSR \
    -R $ref \
    -V $outdir/gatk/$sample.HC.snps.VQSR.vcf.gz \
    --truth-sensitivity-filter-level 99.0 \
    --tranches-file $outdir/gatk/$sample.HC.snps.indels.tranches \
    --recal-file $outdir/gatk/$sample.HC.snps.indels.recal \
    -mode INDEL \
    -O $outdir/gatk/$sample.HC.snps.indels.VQSR.vcf.gz && echo "** SNPs and Indels VQSR $sample done **"

寫成循環(huán)運(yùn)行
bash CHD_Flow_multi.sh內(nèi)容如下:

(wes) root@1100150:~/project# cat CHD_Flow_multi.sh
cat config | while read sample ; do echo $sample; bash ~/project/wesFlow_multi_to_gvcf.sh $sample; done

切換到config目錄提交到后臺(tái)運(yùn)行

cd ~/project/
nohup bash CHD_Flow_multi.sh &

這個(gè)單樣本的calling的腳本第一次使用要拂,因此注釋的時(shí)間可能不全對(duì),先看看脱惰,明天再來繼續(xù)分析吧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末拉一,一起剝皮案震驚了整個(gè)濱河市蔚润,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌嫡纠,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件叉橱,死亡現(xiàn)場離奇詭異,居然都是意外死亡赏迟,警方通過查閱死者的電腦和手機(jī)蠢棱,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來糕再,“玉大人,你說我怎么就攤上這事突想。” “怎么了猾担?”我有些...
    開封第一講書人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵刺下,是天一觀的道長。 經(jīng)常有香客問我工腋,道長,這世上最難降的妖魔是什么擅腰? 我笑而不...
    開封第一講書人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任翁潘,我火速辦了婚禮,結(jié)果婚禮上拜马,老公的妹妹穿的比我還像新娘。我一直安慰自己一膨,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開白布价淌。 她就那樣靜靜地躺著,像睡著了一般蝉衣。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上病毡,一...
    開封第一講書人閱讀 51,624評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音有送,去河邊找鬼。 笑死雀摘,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的阵赠。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼清蚀,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼爹谭!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起旦棉,我...
    開封第一講書人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤绑洛,失蹤者是張志新(化名)和其女友劉穎童本,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體穷娱,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年配深,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了嫁盲。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡缸托,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出俐镐,到底是詐尸還是另有隱情,我是刑警寧澤佩抹,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站匹摇,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏廊勃。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一梭灿、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧堡妒,春花似錦、人聲如沸溉卓。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至爆阶,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間辨图,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來泰國打工故河, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留吆豹,地道東北人杉女。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓鸳吸,卻偏偏與公主長得像,于是被迫代替她去往敵國和親晌砾。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355