在閱讀文獻(xiàn)是看到一些SRA原始數(shù)據(jù)號(hào)碼及其對(duì)于網(wǎng)址,那么這些原始數(shù)據(jù)該如何下載呢。
點(diǎn)擊相應(yīng)的鏈接即可進(jìn)入NCBI網(wǎng)站SRA數(shù)據(jù)庫(kù),如下圖:
如上圖所示掸鹅,下載界面分了幾類以及相應(yīng)的編號(hào),這其中就涉及到了提交SRA數(shù)據(jù)時(shí)的一些信息了拦赠。
SRA 是 Sequence Read Archive 的首字母縮寫巍沙。SRA 與 Trace 最大的區(qū)別是將實(shí)驗(yàn)數(shù)據(jù)與 metadata(元數(shù)據(jù))分離。metadata 是指與測(cè)序?qū)嶒?yàn)及其實(shí)驗(yàn)樣品相關(guān)的數(shù)據(jù)荷鼠,如實(shí)驗(yàn)?zāi)康氖晗埂?shí)驗(yàn)設(shè)計(jì)、測(cè)序平臺(tái)颊咬、樣本數(shù)據(jù)(物種,菌株牡辽,個(gè)體表型等)喳篇。metadata可以分為以下幾類:
Study:accession number 以 DRP,SRP态辛,ERP 開頭麸澜,表示的是一個(gè)特定目的的研究課題,可以包含多個(gè)研究機(jī)構(gòu)和研究類型等奏黑。study 包含了項(xiàng)目的所有 metadata炊邦,并有一個(gè) NCBI 和 EBI 共同承認(rèn)的項(xiàng)目編號(hào)(universal project id),一個(gè) study 可以包含多個(gè)實(shí)驗(yàn)(experiment)熟史。
Sample:accession number以 DRS馁害,SRS,ERS 開頭蹂匹,表示的是樣品信息碘菜。樣本信息可以包括物種信息、菌株(品系) 信息、家系信息忍啸、表型數(shù)據(jù)仰坦、臨床數(shù)據(jù),組織類型等〖拼疲可以通過(guò) Trace 來(lái)查詢悄晃。
Experiment:accession number 以 DRX,SRX凿滤,ERX 開頭妈橄。表示一個(gè)實(shí)驗(yàn)記載的實(shí)驗(yàn)設(shè)計(jì)(Design),實(shí)驗(yàn)平臺(tái)(Platform)和結(jié)果處理 (processing)三部分信息鸭巴。實(shí)驗(yàn)是 SRA 數(shù)據(jù)庫(kù)的最基本單元眷细,一個(gè)實(shí)驗(yàn)信息可以同時(shí)包含多個(gè)結(jié)果集(run)。
Run:accession number 以DRR鹃祖,SRR溪椎,ERR 開頭。一個(gè) Run 包括測(cè)序序列及質(zhì)量數(shù)據(jù)恬口。
Submission:一個(gè) study 的數(shù)據(jù)校读,可以分多次遞交至 SRA 數(shù)據(jù)庫(kù)。比如在一個(gè)項(xiàng)目啟動(dòng)前期祖能,就可以把 study歉秫,experiment 的數(shù)據(jù)遞交上去,隨著項(xiàng)目的進(jìn)展养铸,逐批遞交 run 數(shù)據(jù)雁芙。study 等同于項(xiàng)目,submission 等同于批次的概念钞螟。