在閱讀文獻時,會得到一些轉錄組的數(shù)據(jù)蒲障。那么我們如何下載這些轉錄組數(shù)據(jù)呢歹篓?以SRR1039510為例
一般轉錄組分析都會在服務器上進行瘫证,所以在下載之前,需要配置好環(huán)境庄撮,下載好相關軟件(以后會詳細的列出來)
#####方法一:使用prefetch 下載背捌。?
prefetch SRR1039510
####此方法非常慢,經常失敗
#####方法二:wget + link?
####link 可以在SRA Explorer 網站中找到 (https://sra-explorer.info/)
wget ftp://ftp.sra.ebi.ac.uk/vol1/srr/SRR103/000/SRR1039510
#####也非常慢可能需要一個小時
#####方法三: 使用ascp 命令下載 (速度快)
#####安裝Aspera包:
conda install -c hcc aspera-cli
#####在SRA Explorer網站中找到下載命令并運行 (在Aspera commands for downloading FastQ files下)
#!/usr/bin/env bash
ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR103/000/SRR1039510/SRR1039510_1.fastq.gz . && mv SRR1039510_1.fastq.gz SRR1039510_GSM1275864_N61311_Alb_Homo_sapiens_RNA-Seq_1.fastq.gz
ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR103/000/SRR1039510/SRR1039510_2.fastq.gz . && mv SRR1039510_2.fastq.gz SRR1039510_GSM1275864_N61311_Alb_Homo_sapiens_RNA-Seq_2.fastq.gz
######方法四: 直接下載
#####進入網站:https://www.ebi.ac.uk/ena/browser/home洞斯,找到基因并進行下載(可選fastq文件或sra文件)
一般我們在下載sra文件后毡庆,都需要使用fastq-dump命令將其轉化為fastq文件,所以在下載過程中如果有fastq文件烙如,可以直接下載fastq文件么抗。