以下內(nèi)容來(lái)之知乎 :https://zhuanlan.zhihu.com/p/62914954悄晃,感謝作者分享玫霎,我只是Mark下來(lái)給自己看,再次申明妈橄,不是原創(chuàng):
自己補(bǔ)充概括三點(diǎn):1. 下載Accession List? ?庶近;? 2.下載RunInfo Table,里面記錄了樣品信息眷细、建庫(kù)信息拦盹、測(cè)序信息鹃祖、數(shù)據(jù)信息?溪椎;? ? 3. 將SRA數(shù)據(jù)變成 fastq數(shù)據(jù),fastq-dump 命令恬口,注意是單端還是雙端測(cè)序校读。
fastq-dump -I --split-files SRR390728? ????????????Produces two fastq files (--split-files) containing ".1" and ".2" read suffices (-I) for paired-end data.
--split-spot????????????????????????????????????????????????????????Split spots into individual reads.
一.SRA數(shù)據(jù)庫(kù):
NCBI網(wǎng)站儲(chǔ)存二代測(cè)序原始數(shù)據(jù)的數(shù)據(jù)庫(kù).
(一)SRA數(shù)據(jù)類型:
1.Studies:研究課題
2.Experiments:實(shí)驗(yàn)設(shè)計(jì)
3.Samples:樣品信息
4.Runs:測(cè)序結(jié)果
(二)對(duì)應(yīng)序列前綴:
1.SRP/ERP:對(duì)應(yīng)studies
2.SRX:對(duì)應(yīng)Experiments
3.SRS:對(duì)應(yīng)Samples
4.SRR:對(duì)應(yīng)Runs
二.Protocol for analysis:
1.登入NCBI-SRA數(shù)據(jù)庫(kù)并下載SRAToolkit使用:
下載地址:
Main : Sequence Read Archive : NCBI/NLM/NIH?trace.ncbi.nlm.nih.gov
選擇相應(yīng)操作系統(tǒng)版本下載,本文以 MS Windows 64 bit architecture為例祖能,解壓至相關(guān)目錄(自己指定位置吧(? ̄? ??  ̄??))
2.選擇SRA數(shù)據(jù)庫(kù)歉秫,輸入關(guān)鍵詞或序列號(hào)檢索,并點(diǎn)擊進(jìn)入結(jié)果鏈接
3.點(diǎn)擊詳細(xì)信息界面中的研究課題編碼SRP
4.點(diǎn)擊右方“Related SRA data”中的測(cè)序結(jié)果Runs的數(shù)字
5.在下方列表中選擇需要的原始數(shù)據(jù)序列號(hào)下載养铸,點(diǎn)擊“Download”欄Accession List
6.下載二代測(cè)序數(shù)據(jù):
(1)使用“運(yùn)行”輸入CMD打開(kāi)命令行界面雁芙,輸入以下內(nèi)容并運(yùn)行:
prefetch.exe的路徑\prefetch.exe?—option-file?下載的序列號(hào)文件的路徑\?序列文件
例:D:\WHU_2102\Tools\sartoolkit.2.9.6-win64\bin\prefetch.exe —option-file C:\Users\asus\Desktop\SRA_Acc_List.txt
(2)下載完成,二次測(cè)序原始數(shù)據(jù)位于用戶家目錄ncbi文件夾中
例:C:\Users\asus\ncbi\public\sra\SRR4289741.sra
7.sra格式轉(zhuǎn)化為fastq格式:
(1)使用“運(yùn)行”輸入CMD打開(kāi)命令行界面钞螟,輸入以下內(nèi)容并運(yùn)行:
fastq-dump.exe的路徑\fastq-dump.exe?—split-3?sra文件的路徑\?sra文件
例:D:\WHU_2102\Tools\sartoolkit.2.9.6-win64\bin\fastq-dump.exe?—split-3 C:\Users\asus\ncbi\public\sra\SRR4289741.sra
(2)轉(zhuǎn)換完成兔甘,fastq格式數(shù)據(jù)存在于原數(shù)據(jù)相同目錄下
“—split-3”中“-3”表示雙端測(cè)序,輸出轉(zhuǎn)換結(jié)果為兩個(gè)fastq文件(如果樣品為單端測(cè)序只返回一個(gè)fastq文件)
例:C:\Users\asus\ncbi\public\sra\
編者的話:萌新第一次用知乎鳞滨,不足之處還請(qǐng)海涵洞焙,之所以要做這些是因?yàn)樽约涸趯W(xué)生信,發(fā)現(xiàn)網(wǎng)上很多都零散不全拯啦,希望對(duì)每一次的小操作都系統(tǒng)涵蓋一下澡匪,以后還會(huì)不斷更新,大家一起學(xué)習(xí)進(jìn)步吧褒链!(? ̄? ??  ̄??)