CNVnator
服務(wù)器:centos7
- CNVnator 安裝過程
GitHub - abyzovlab/CNVnator: a tool for CNV discovery and genotyping from depth-of-coverage by mapped reads
從git 上下載源碼安裝過程中出現(xiàn)各種錯誤
samtools 鏈接整個文件夾,如果缺少sam.h 或者sam.c 金闽,直接去其他路徑下拷貝過來闸与,都是能夠使用的
root 下載和安裝了赌,這個不容易錯
hstlib 安裝后,hstlib文件夾內(nèi)還有一個htslib文件夾貌夕,需要的*.h 文件基本上都在的伍绳,可以全部復(fù)制過來
因為后續(xù)還是報了找不到各種文件的錯誤,就放棄用源碼安裝了只怎。
conda可以一步安裝成功的
conda install -c bioconda cnvnator
但是執(zhí)行過程中ROOT會報錯袜瞬,root導(dǎo)入包報錯,修改root 安裝包里的<ROOT::Math::FitResult>身堡,依然報錯
在后續(xù)的時候了解到是root版本的不匹配邓尤,或者多個版本,導(dǎo)致錯誤
root各種文件下載:
ROOT: math/mathcore/inc/Fit/FitResult.h Source File (cern.ch)
例如錯誤:
[dujl@master cnvnator]$ cnvnator -root file.root -call 1000
Error in <ROOT::Math::FitResult>: FitConfiguration and Minimizer result are not consistent
Number of free parameters from FitConfig = 3
Number of free parameters from Minimizer = 2
Error in <ROOT::Math::FitResult>: FitConfiguration and Minimizer result are not consistent
Number of free parameters from FitConfig = 3
Number of free parameters from Minimizer = 2
[dujl@master cnvnator]$
conda 創(chuàng)建虛擬環(huán)境贴谎,重新下載cnvator汞扎,注意root版本為6.20,按照以下順序安裝(測試已經(jīng)成功)
安裝命令行
conda create -n cnvnator python=3.8 #創(chuàng)建cnvnator 虛擬環(huán)境
conda install -c conda-forge root_base=6.20 #安裝root 指定版本
conda install -c conda-forge -c bioconda cnvnator #安裝cnvnator
source activate cnvnator #進(jìn)入cnvnator 虛擬環(huán)境
- cnvnator分析命令行
命令行
cnvnator -root file.root -tree BPX21-023026FFPED750GT1_P750_gDNA.rmdup.sort.bam -chrom 1 #選擇1號染色體測試
cnvnator -root file.root -his 1000 -fasta 1.fa
cnvnator -root file.root -stat 1000
cnvnator -root file.root -partition 1000
cnvnator -root file.root -call 1000 > cnv.call.txt
~/Biosoftware/CNVnator/cnvnator2VCF.pl cnv.call.txt genome >cnv.call.vcf #轉(zhuǎn)為vcf格式赴精,這個perl腳本從GitHub上CNVnator下載
分析完成后的文件夾
(cnvnator) [dujl@master cnvnator]$ ll
total 1153448
-rw-r--r--. 1 dujl samba 253105755 Oct 9 10:00 1.fa
-rw-r--r--. 1 dujl samba 916953397 Oct 4 16:51 BPX21-023026FFPED750GT1_P750_gDNA.rmdup.sort.bam
-rw-r--r--. 1 dujl samba 4818872 Oct 4 16:51 BPX21-023026FFPED750GT1_P750_gDNA.rmdup.sort.bam.bai
-rw-r--r--. 1 dujl samba 41512 Oct 11 11:18 cnv.call.txt
-rw-r--r--. 1 dujl samba 95360 Oct 11 12:35 cnv.call.vcf
-rw-r--r--. 1 dujl samba 984 Oct 11 12:18 cnvnator.sh
cnv.call.txt文件沒有表名佩捞,每列依次為:
CNV_type coordinates CNV_size normalized_RD e-val1 e-val2 e-val3 e-val4 q0
cnv.call.txt 部分展示
CNV_type coordinates CNV_size normalized_RD e-val1 e-val2 e-val3 e-val4 q0
duplication chr1:5184001-6958000 1.774e+06 1.67425e+06 2.28272e-05 0 2.55988e-05 0 0.0128315
deletion chr1:6958001-7068000 110000 990512 0.0356524 2.21302e-24 0.121439 8.85199e-24 0
duplication chr1:7134001-7708000 574000 1.09496e+06 0 4.65726e-164 0 1.86289e-163 0.0283401
deletion chr1:7769001-7779000 10000 2.09421e+06 9991.85 2.80386e+06 26600.6 1.12153e+07 0
duplication chr1:7779001-7800000 21000 1.57455e+06 1399.46 1369.15 3056.16 5476.55 0
deletion chr1:7800001-7858000 58000 711020 528.686 9.96383e-09 1745.55 3.98549e-08 0
duplication chr1:7858001-7860000 2000 1.48479e+06 281234 7.17758e+08 1 1 0
deletion chr1:7860001-8002000 142000 998181 0.0397676 5.15346e-34 0.0833459 2.06136e-33 0
duplication chr1:8013001-14379000 6.366e+06 7.05773e+07 1.09653e-11 0 1.3423e-11 0 0.00126562
deletion chr1:14379001-14381000 2000 6.99059e+06 125017 0 1 1 0
duplication chr1:14381001-14384000 3000 2.17001e+06 165248 3.58881e+08 1 1 0
- 對于結(jié)果文件的一些思考
如上第四列normalize_RD(矯正后的RD)感覺偏大很多
Samtools depth 計算了chr1:5184001-6958000,平均深度約100左右
cnvnator 矯正公式:
image.png
當(dāng)樣本是panel測序蕾哟,以及測序深度不高時一忱,normalize_RD異常的離譜。
這種情況應(yīng)該如何矯正谭确?