? ? ? ? 之前下載SRA的數(shù)據(jù)谨垃,使用 prefetch -v SRA? ? --max-size 100G? 下載數(shù)據(jù)脉课,經(jīng)常會出現(xiàn)下到一半就斷網(wǎng)的情況斑匪;后來嘗試使用wget下載,但wget下載后的SRA數(shù)據(jù)耗跛,在用fastq-dump轉(zhuǎn)化成fastq時,會出現(xiàn)錯誤(使用迅雷下載就不會出現(xiàn)這種問題)翘骂。后來搜集到一種方法驱闷,現(xiàn)記錄下來:
Step1:首先下載aspera并安裝
? ? ? ? ? ? ? ? wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727-linux-64.tar.gz
? ? ? ? ? ? ? ? tar -xzvf aspera-connect-3.7.4.147727-linux-64.tar.gz
? ? ? ? ? ? ? ? sh??aspera-connect-3.7.4.147727-linux-64.sh
? ? ? ? ? ? ? ? 查看是否安裝成功 cd 到家目錄,然后ls -a之后會有.aspera目錄敲董;.aspera/connect/bin/ascp? -h???測試是否安裝成功紫皇;
?Step2:將ascp 添加到環(huán)境變量
? ? ? ? ? ? ? ?echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
? ? ? ? ? ? ? ?source ~/.bashrc
?Step3:使用prefetch下載數(shù)據(jù)
? ? ? ? ? ? ? ? prefetch -v ERR1955423 --max-size 100G
? ? ? ? ? ? ? ? ?這樣 perfetch就會 默認(rèn)aspera下載
? ? ? ? ? ? ? ? ?sra數(shù)據(jù)會下載到家目錄下的ncbi/public/sra中
?Step4:將SRA轉(zhuǎn)化為fastq(pair-end)
fastq-dump --gzip --split-3 --defline-qual '+' --defline-seq '@$ac-$si/$ri'? ?ERR1955398.sra
備忘錄-----SRA在NCBI上的存放路徑
以下是NCBI 存放SRR5483089的路徑
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR548/SRR5483090/
可見ftp構(gòu)成:
進入即可看到FTP文件,可以直接下載或者通過復(fù)制鏈接用wget 下載
如果按SRP下載文件的話,構(gòu)成是
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/+SRP+SRP前三位數(shù)字?(105) +/SRP+SRP的完整登陸號(105315)
參考網(wǎng)址:
https://www.cnblogs.com/ywliao/p/7356528.html
http://www.reibang.com/p/19ae29e54c59