數(shù)據(jù)庫下載SRR文件
prefetch -O output --option-file SRR_Acc_List.txt#批量下載
prefetch SRRXXXXXXXX#單獨下載一個
把當前文件夾的下一級子文件夾中的sra文件移動到當前文件夾來
find . -mindepth 2 -maxdepth 2 -type f -name "*.sra" -exec mv {} . \;
這條命令的解釋如下:
find .:從當前目錄開始查找暴区。
-mindepth 2:最小深度為2歼郭,意味著它將跳過當前目錄(深度1)覆享。
-maxdepth 2:最大深度也為2昔驱,這意味著它只會在當前目錄的直接子目錄中查找。
-type f:只查找文件。
-name "*.sra":查找所有以.sra結尾的文件。
-exec mv {} . ;:對于找到的每個文件翼闹,執(zhí)行mv命令將其移動到當前目錄(.表示當前目錄)
在運行此命令之前,請確保您在想要操作的目錄中蒋纬,并且理解這個命令會將所有找到的.sra文件移動到當前目錄猎荠,這可能會覆蓋任何同名的現(xiàn)有文件。如果您想先看看哪些文件將被移動颠锉,您可以先運行不帶-exec mv {} . ;的命令法牲,
find . -mindepth 2 -maxdepth 2 -type f -name "*.sra"
將SRA文件轉化為fastq文件
fasterq-dump -S -e 10 *.sra #-S是--split-files,#-e 10開十線程琼掠,#*.sra所有sra文件 --include-technical為單細胞才加
fasterq-dump -S -e 10 SRRXXXXXXX.sra#轉化單獨一個文件
文件轉移和處理
mv *.fastq.gz ./raw_data/ #將fastq.gz文件移動到當前目錄的raw_data文件夾
rm -i *.sra #刪除當前文件夾中的sra文件
將fastq文件壓縮為fq.gz文件
gzip *.fastq #-k 保留原文件,-d是解壓停撞,
gzip SRRXXXXXX.fastq#壓縮單獨一個
ENA下載鏈接改名
###將wget -nc ftp://ftp.sra.ebi.ac.uk改成fasp.sra.ebi.ac.uk:
sed -i 's/wget -nc ftp:\/\/ftp.sra.ebi.ac.uk/fasp.sra.ebi.ac.uk:/g' your_file.sh
Aspera高速下載(linux)
ascp -QT -l 300m -P33001 -k 1 -i ~/mambaforge-pypy3/envs/download/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR200/083/SRR20045883/SRR20045883_1.fastq.gz .
批量腳本
#!/bin/bash
cat fq.txt |while read id
do
ascp -QT -l 300m -P33001 -k 1 -i ~/mambaforge-pypy3/envs/kingfisher/etc/asperaweb_id_dsa.openssh era-fasp@$id .
done