最近學(xué)習(xí)了生信技能樹的《Chip-seq測序數(shù)據(jù)分析》課程吠各,在下載SRA數(shù)據(jù)的時候唠雕,卡殼了。搞了好幾天骇吭。
按照曾老師B站中的說法橙弱,應(yīng)該用sra-tools中的prefetch來下載,但是速度就像冬眠的蝸牛燥狰,紋絲不動棘脐!只好另擇他徑。
微信發(fā)給曾老師龙致,提示需要用aspera來下載蛀缝。搜了下面的兩個帖子,
學(xué)員分享-aspera踩坑記錄
https://cloud.tencent.com/developer/article/1665360
使用aspera從EBI下載fastq數(shù)據(jù)目代,拋棄NCBI的SRA數(shù)據(jù)庫吧屈梁!
https://mp.weixin.qq.com/s/8xWl_DAYhFnLjdlg5ZcdIw
但真正正規(guī)的說明書在這里:
https://ena-docs.readthedocs.io/en/latest/retrieval/file-download.html#using-aspera
結(jié)合自己一點薄弱的Linux知識,愣是給搞下來了榛了。
具體步驟如下:
首先創(chuàng)造了虛擬環(huán)境chipseq在讶,所有的操作都是在其中進行。
利用conda安裝aspera:
conda install -y -chcc aspera-cli #注意帖子里面空格缺乏霜大,都是坑构哺。
which ascp #找到ascp的位置
找到要下載的數(shù)據(jù)的BioProject;一般知道它的GEO accession和SRA number就可以從GEO和SRA網(wǎng)站上找到战坤。通過下面這個網(wǎng)站進入https://www.ebi.ac.uk/ena/browser/home
圖片1
在其中相應(yīng)位置輸入PRJNA156325曙强,就可以找到自己想要的SRA數(shù)據(jù)。
注意show column selection的下拉菜單途茫,其中要選中sra_ftp碟嘴,(具體我也不知道ftp是個什么鬼,帖子里面還說用xftp傳到自己的Linux系統(tǒng)中的操作目錄中囊卜,我也不會臀防,悶著頭往前操作)眠菇。如果選擇fastq_ftp,就可以看到gz格式的數(shù)據(jù)袱衷。傳說fastq數(shù)據(jù)是SRA數(shù)據(jù)處理后得到的捎废,也不知道,后面學(xué)到了再說吧致燥。#這里的ftp地址很重要登疗,我就是參照帖子里的下載方式,用這個地址改一下嫌蚤,然后下載的辐益。
登錄自己的騰訊云
PS: 這幾天搗鼓了幾下,學(xué)會了用阿里云app登錄騰訊云脱吱,終于可以在手機上操作自己的騰訊云操作系統(tǒng)了智政,功夫不負有心人。
[root@VM-0-11-centos ~]#su xiangyukong
(base) [xiangyukong@VM-0-11-centos root]$ conda
deactivate #這里(base)是提示在base這個虛擬環(huán)境中箱蝠,可以用conda deactivate退出這個操作環(huán)境续捂,變成如下樣子
[xiangyukong@VM-0-11-centos root]$ cd ~
[xiangyukong@VM-0-11-centos ~]$source activate
chipseq#繼續(xù)操作,進入chipseq虛擬環(huán)境中宦搬。用conda
info --envs可以看到自己究竟有幾個虛擬環(huán)境牙瓢。
(chipseq) [xiangyukong@VM-0-11-centos ~]$
我的srr.list在~/projetc/epi/sra里面:下載正式開始:注意這里的"$id",很神奇哦间校。
(chipseq) [xiangyukong@VM-0-11-centos ~]$catsrr.list |while read id;
do
echo "ascp -k 1 -QT -l 300m -P33001 -i?~/miniconda3/envs/chipseq/etc/asperaweb_id_dsa.opensshera-fasp@fasp.sra.ebi.ac.uk:/vol1/srr/SRR391/"$id"~/project/epi/sra";
done>sra.download.sh
原來看著很迷糊矾克,后來仔細一看,不就是while-do-done嘛憔足。
后面的>sra.download.sh不知道是干啥的胁附。
參考帖子里面的內(nèi)容,執(zhí)行了下面這句滓彰,據(jù)說是可以后臺執(zhí)行的汉嗽。sra.download.log也不知道是干啥的。
nohup bash sra.download.sh>sra.download.log &
于是就下載成功了找蜜。
圖片2,可以看到下載過程稳析。
可以用top看到執(zhí)行的程序洗做,
用ps -ef | grep ascp看到執(zhí)行的ascp程序。