從NCBI上下載SRA原始數(shù)據(jù)呻畸,使用SRA TOOLKIT 進(jìn)行下載和轉(zhuǎn)化移盆。
1. 下載SRA Toolkit (注意找準(zhǔn)自己的版本)
https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software
2. 解壓,放在文件夾下伤为,并記住路徑
我這里放在“/Users/baiyunfan/bio”下面
3. 打開終端或者Linux虛擬機(jī)
4. 配置環(huán)境變量
echo "export PATH=$PATH:/Users/baiyunfan/bio/sratoolkit.2.9.6-1-mac64/bin" >> ~/.bashrc
source ~/.bashrc
將路徑塞進(jìn)bashrc里咒循,source是運(yùn)行一下
5. 下載單個(gè)數(shù)據(jù)
prefetch SRR2061753
6. 下載多個(gè)數(shù)據(jù)
echo SRR2061753 > id
echo SRR2061752 >>id
prefetch --option-file id
如果文件下著下著就掉線了怎么辦?
nohup prefetch --option-file id &
7. 文件下到~/ncbi/public/sra中
8. 查看是雙端還是單端
NCBI里會(huì)描述是雙端測序還是單端绞愚,具體要詳細(xì)看一下叙甸,如果是雙端要拆分。
網(wǎng)址參照:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=PRJNA281942&go=go 在左上角輸入你的SRA序號即可
9.sra轉(zhuǎn)化成fastq格式
單端測序(single-end)
fastq-dump SRR2061752.sra
雙端測序(pair-end)
fastq-dump --split-3 SRR2061752.sra
對您有幫助的話位衩,還請留個(gè)贊裆蒸。