DNA測序數(shù)據(jù)的獲取休建,質控和格式轉換

Aspera及SRAToolkit的安裝運行

一:Aspera的安裝
1.建立安裝文件夾

mkdir ~/Biosofts
cd ~/Biosofts

2.下載源代碼
wget https://download.asperasoft.com/download/sw/connect/3.6.2/aspera-connect-3.6.2.117442-linux-64.tar.gz
3.解壓
tar zvxf aspera-connect-3.6.2.117442-linux-64.tar.gz
4.加入shell腳本
sh aspera-connect-3.6.2.117442-linux-64.sh
5.測試Aspera是否安裝成功
~/.aspera/connect/bin/ascp -h

5.png

6.配置環(huán)境變量
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
7.測試Aspera路徑是否成功加入環(huán)境變量
ascp -h

6.png

二:SRAToolkit的安裝
1.下載源代碼到Biosofts
wget -P ~/Biosofts/ https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-ubuntu64.tar.gz
2.解壓
tar zvxf ~/Seqs/sratoolkit.2.9.2-ubuntu64.tar.gz -C ~/Biosofts
3.測試安裝是否成功
~/Biosofts/sratoolkit.2.9.2-ubuntu64/bin/fastq-dump -h

8.png

4.配置環(huán)境變量
echo 'export PATH=~/Biosofts/sratoolkit.2.9.2-ubuntu64/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
5.再次測試安裝是否成功
fastq-dump

7.png

三:Aspera下載SRA文件
1.建立Seqs文件夾保存下載序列
mkdir ~/Seqs
2.下載SRA文件到Seqs文件夾
ascp -T -i /home/huangxun/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR620/SRR6208854/SRR6208854.sra ~/Seqs/

1.png

這個失敗了绩脆,但是perfetch能成功妻柒,
還可以從ENA數(shù)據(jù)庫下載
ascp -P 33001 -k 1 -l 200m -T -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR620/004/SRR6208854/SRR6208854.fastq.gz ./
12.png

3.批量下載
nano ~/Seqs/sra_list.txt
/sra/sra-instant/reads/ByRun/sra/SRR/SRR623/SRR6232298/SRR6232298.sra
/sra/sra-instant/reads/ByRun/sra/SRR/SRR623/SRR6232299/SRR6232299.sra
按ctrl+x保存退出
4.批量下載sra_list.txt列表中的文件
ascp -T -i /home/huangxun/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m --mode recv --host ftp-private.ncbi.nlm.nih.gov --user anonftp --file-list ~/Seqs/sra_list.txt ~/Seqs/

2.png

這個也失敗了

四:prefetch命令下載SRA文件
1.下載單個文件
prefetch SRR6232298

11.png

2.下載多個文件
prefetch --option-file Seqs/SRR_lists.txt

3.png

五:解壓SRA文件
1.解壓為gz文件属提,節(jié)省空間
fastq-dump --split-files ~/ncbi/public/sra/SRR6232298.sra

4.png

2.批量解壓

#!/bin/sh
for i in *sra
do
echo $i
fastq-dump --gzip --split-files $i
done

Fastqc安裝及運行

一:java環(huán)境安裝
1.建立/usr/java目錄
sudo mkdir /usr/java
2.解壓
sudo tar -zvxf ~/Biosofts/jdk-8u172-linux-x64.tar.gz -C /usr/java/
3.相關目錄建立軟連接

sudo cd /usr/java
sudo ln -s jdk1.8.0_172 latest
sudo ln -s /usr/java/latest default

4.配置環(huán)境變量

sudo echo 'export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH'>> /etc/profile
sudo echo 'export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar'>> /etc/profile
source /etc/profile

5.測試是否安裝成功
java -version

9.png

二:fastqc安裝
1.創(chuàng)建安裝文件夾
cd ~/Biosofts
2.下載
wegt http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.7.zip
3.建立子目錄
mkdir ~/Biosofts/fastqc
4.解壓
unzip ~/Biosofts/fastqc_v0.11.7.zip -d ~/Biosofts/
chmod +x ~/Biosofts/FastQC/fastqc
~/Biosofts/FastQC/fastqc -h
5.配置環(huán)境變量
echo 'export PATH=~/Biosofts/FastQC:$PATH'>>~/.bashrc
source ~/.bashrc
6.檢測是否安裝成功
fastqc -h

10.png

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末使套,一起剝皮案震驚了整個濱河市西采,隨后出現(xiàn)的幾起案子凰萨,更是在濱河造成了極大的恐慌,老刑警劉巖械馆,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件胖眷,死亡現(xiàn)場離奇詭異,居然都是意外死亡霹崎,警方通過查閱死者的電腦和手機珊搀,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來尾菇,“玉大人食棕,你說我怎么就攤上這事〈砉粒” “怎么了簿晓?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長千埃。 經(jīng)常有香客問我憔儿,道長,這世上最難降的妖魔是什么放可? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任谒臼,我火速辦了婚禮,結果婚禮上耀里,老公的妹妹穿的比我還像新娘蜈缤。我一直安慰自己,他們只是感情好冯挎,可當我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布底哥。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪趾徽。 梳的紋絲不亂的頭發(fā)上续滋,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機與錄音孵奶,去河邊找鬼疲酌。 笑死,一個胖子當著我的面吹牛了袁,可吹牛的內容都是我干的朗恳。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼载绿,長吁一口氣:“原來是場噩夢啊……” “哼僻肖!你這毒婦竟也來了?” 一聲冷哼從身側響起卢鹦,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤臀脏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后冀自,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體揉稚,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年熬粗,在試婚紗的時候發(fā)現(xiàn)自己被綠了搀玖。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡驻呐,死狀恐怖灌诅,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情含末,我是刑警寧澤猜拾,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站佣盒,受9級特大地震影響挎袜,放射性物質發(fā)生泄漏。R本人自食惡果不足惜肥惭,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一盯仪、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蜜葱,春花似錦全景、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽滞伟。三九已至,卻和暖如春馆纳,著一層夾襖步出監(jiān)牢的瞬間诗良,已是汗流浹背汹桦。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工鲁驶, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人舞骆。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓钥弯,卻偏偏與公主長得像,于是被迫代替她去往敵國和親督禽。 傳聞我的和親對象是個殘疾皇子脆霎,可洞房花燭夜當晚...
    茶點故事閱讀 42,722評論 2 345