? ? ? ?最近逛Github晒杈,發(fā)現(xiàn)一個新出的BSA自動化流程北秽,就叫QTL-seq,看起來還蠻簡單方便的囤屹,所以搞了一下試試氏豌。
? ? ? ?BSA原理就不多說了台诗,在實際操作中驱敲,高铁蹈、低池子至少得兩個,然后就是可以選擇測還是不測親本众眨。這套流程是需要親本測序數(shù)據(jù)的握牧,還有一些流程是不需要的,例如DeepBSA娩梨、QTLseqr等沿腰,所以根據(jù)自己試驗經(jīng)費來定就好。個人覺得測一下親本多不了幾個錢狈定,可以測了颂龙,還可以搞搞重測序分析嘛。
? ? ? ? 安裝挺簡單的纽什,我就喜歡用conda厘托,這個流程又支持conda,所以稿湿,上吧
? ? ? ? ? ?conda install -c bioconda qtlseq
? ? ? ? 完事就安裝完畢了,這個流程里面包含了BWA押赊、samtools饺藤、BCFtools、Snpeff流礁、Trimmomatic等軟件涕俗,還有一些python依賴庫用于繪圖什么的,反正都可以用上面那個命令安裝完神帅。
? ? ? ? 使用命令很簡單再姑,就一行
qtlseq?
usage: qtlseq -r <FASTA> -p <BAM|FASTQ> -b1 <BAM|FASTQ>
? ? ? ? ? ? ? -b2 <BAM|FASTQ> -n1 <INT> -n2 <INT> -o <OUT_DIR>
? ? ? ? ? ? ? [-F <INT>] [-T] [-e <DATABASE>] [--species <NAME>]
? ? ? ? 這玩意需要準(zhǔn)備的數(shù)據(jù)有幾個,第一部分是兩個親本的測序數(shù)據(jù)找御,使用的是參數(shù)-p輸入 兩個親本就輸入兩次-p
-p P1_1.fq,P1_2.fq
-p P2_1.fq,P2_2.fq
? ? ? ? 第二部分是兩個池的數(shù)據(jù)元镀,
?-b1 bulk1_1.fq,bulk1_2.fq,
?-b2 bulk2_1.fq,bulk2_1.fq,
? ? ? 測序數(shù)據(jù)準(zhǔn)備完了,剩下就是一些細(xì)節(jié)參數(shù)霎桅,比如每個池子里面的樣本數(shù)
-b1 int
-b2 int
? ? 能用的線程數(shù)
-t cpus
? ? ? 這軟件有個特殊的功能栖疑,似乎是有人搞了些驗證過的snp,用于過濾滔驶,目前支持Arabidopsis, Cucumber, Maize, Rapeseed,Rice, Tobacco, Tomato, Wheat, and Yeast等物種遇革,可以增加snp的準(zhǔn)確性吧。
qtlseq -r reference.fasta \
? ? ? -p parent.1.fastq,parent.2.fastq \
? ? ? -b1 bulk_1.1.fastq,bulk_1.2.fastq \
? ? ? -b2 bulk_2.1.fastq,bulk_2.2.fastq \
? ? ? -n1 20 \
? ? ? -n2 20 \
? ? ? -t 48 \
? ? ? -o example_dir
? ? 然后個人試用的話,感覺還是太慢了萝快,測序數(shù)據(jù)清理用的Trimmomatic慢出天際锻霎,比對走的是bwa流程,其實講究加速的話揪漩,可以先用fastp-----bwa-mem2-------sambamba流程先建立好所有的去重的bam文件旋恼,然后再把bam文件進(jìn)行輸入,速度快得多氢拥,所以我個人更喜歡如下這樣:
qtlseq -r reference.fasta \
? ? ? -p parent_1.bam \
? ? ? -p parent_2.bam \
? ? ? -b1 bulk_1.bam \
? ? ?-b2 bulk_2.bam \
? ? ? ?-n1? 20? \
? ? ? -n2 20 \
? ? ? ?-t 48 \
? ? ? -o example_dir
最后輸出的文件夾里面包含了各種中間內(nèi)容:
├── 10_ref
│? ├── reference.fasta
│? ├── reference.fasta.amb
│? ├── reference.fasta.ann
│? ├── reference.fasta.bwt
│? ├── reference.fasta.fai
│? ├── reference.fasta.pac
│? └── reference.fasta.sa
├── 20_bam
│? ├── bulk1.filt.bam
│? ├── bulk1.filt.bam.bai
│? ├── bulk2.filt.bam
│? ├── bulk2.filt.bam.bai
│? ├── parent.filt.bam
│? └── parent.filt.bam.bai
├── 30_vcf
│? ├── qtlseq.vcf.gz
│? └── qtlseq.vcf.gz.tbi
├── 40_qtlseq
│? ├── bulk1_SNPindex.png
│? ├── bulk2_SNPindex.png
│? ├── delta_SNPindex.png
│? ├── sliding_window.tsv
│? ├── sliding_window.p95.tsv
│? ├── sliding_window.p99.tsv
│? ├── np_index.tsv
│? ├── snp_index.p95.tsv
│? └── snp_index.p99.tsv
└── log
? ├── bcftools.log
? ├── bgzip.log
? ├── bwa.log
? ├── samtools.log
? └── tabix.log
還有圖蚌铜,看起來還不錯。