參考:
以水稻為例教你如何使用BSA方法進(jìn)行遺傳定位(上篇) - 簡(jiǎn)書(shū) (jianshu.com)
一扭吁、環(huán)境構(gòu)建
為了防止主頁(yè)過(guò)于混亂夸盟,我一般把跑的這些流程放在workspace目錄
cd workspace
mkdir BSA
cd BSA
mkdir data
二、數(shù)據(jù)準(zhǔn)備
- 文章:Identification of a cold-tolerant locus in rice (Oryza sativa L.) using bulked segregant analysis with a next-generation sequencing strategy - PubMed (nih.gov)
- 材料:Kongyu131(耐寒)×Dongnong422(不耐寒)→F2→RIL
-
文章的圖:
- 數(shù)據(jù)下載:
①參考序列(IRGSP-1.0_genome.fasta)碾褂;
mkdir data
cd data
mkdir ref
cd ref
#下載參考序列
wget https://rapdb.dna.affrc.go.jp/download/archive/irgsp1/IRGSP-1.0_genome.fasta.gz
gunzip IRGSP-1.0_genome.fasta.gz
#bwa構(gòu)建索引
bwa index IRGSP-1.0_genome.fasta
#SRR6327815, SRR6327816, SRR6327817, SRR6327818
②測(cè)序數(shù)據(jù)(SRR6327815, SRR6327816, SRR6327817, SRR6327818)
ENA Browser (ebi.ac.uk)搜索SRR號(hào)獲取下載序列分预,如下圖叮称,復(fù)制鏈接
在NCBI上下載的是SRA格式酣藻,需要做數(shù)據(jù)轉(zhuǎn)換舒萎,而從ENA上可以直接下載壓縮過(guò)的fastq文件
#{a,b}.txt → a.txt b.txt
vi SRR.txt
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/005/SRR6327815/SRR6327815_{1,2}.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/006/SRR6327816/SRR6327816_{1,2}.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/007/SRR6327817/SRR6327817_{1,2}.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR632/008/SRR6327818/SRR6327818_{1,2}.fastq.gz
#后臺(tái)批量下載
wget -b -i SRR.txt