Bioproject一般是這個數(shù)據(jù)的一個大的集合,或者說是一個上層的概念厢汹,你可以認為就是項目螟深。
使用ebi下載geo數(shù)據(jù)?使用bioproject編號下載即可烫葬。
網(wǎng)址:https://www.ebi.ac.uk/ena/browser/view/
GEO ID一般指代的是NCBI基因數(shù)據(jù)上傳后的ID代號界弧,一般都是一個頁面,這個頁面一般提供的都是中間文件厘灼,比如轉錄組數(shù)據(jù)的表達矩陣夹纫,芯片數(shù)據(jù)的中間注釋文件咽瓷,單細胞測序的細胞注釋设凹,突變的vcf突變文件等等。SRA則是這些中間數(shù)據(jù)的來源分析的原始數(shù)據(jù)茅姜,但是這個原始數(shù)據(jù)單指測序闪朱,芯片的原始數(shù)據(jù)其實很小月匣,一般都丟在GEO里面。一般是.sra格式奋姿,可以通過NCBI官方的SRAtools轉碼形成fq文件锄开。因此他們的關系是Bioproject 項目 - GEO(項目結果中間數(shù)據(jù)) - SRA(項目原始數(shù)據(jù)),其實bioproject中還有別的称诗,比如樣本信息萍悴,實驗信息,平臺信息等等寓免⊙⒂眨基本上就是一個從屬關系,另外注意GEO的部分可以跳過袜香,部分文章只提供SRA