GEO (Gene Expression Omnibus)是一個(gè)公共功能基因組學(xué)數(shù)據(jù)存儲(chǔ)庫(kù),支持符合 MIAME 標(biāo)準(zhǔn)的數(shù)據(jù)提交。 接受基于陣列和序列的數(shù)據(jù)茫虽。 提供工具來(lái)幫助用戶查詢和下載實(shí)驗(yàn)和策劃的基因表達(dá)譜元咙∈酒簦基本上文章中原始測(cè)序數(shù)據(jù)和過(guò)程文件都會(huì)提交在這個(gè)數(shù)據(jù)庫(kù)中浑槽,只上傳原始測(cè)序文件則傳到SRA數(shù)據(jù)庫(kù)中蒋失。
上傳流程
1.選擇注冊(cè)賬號(hào),可以根據(jù)當(dāng)前賬號(hào)(163實(shí)測(cè)沒(méi)問(wèn)題)直接注冊(cè)桐玻,也可以通過(guò)谷歌郵箱注冊(cè)(后面填寫(xiě)信息要用(https://www.google.com/intl/zh-CN_cn/gmail/about/)
2.填寫(xiě)信息高镐,然后save,然后選擇右上角的GEO submissions畸冲,在選擇new submissions
3.點(diǎn)擊Sunbmit high-throughput sequencing观腊,詳細(xì)閱讀此界面邑闲,上傳時(shí)一共需要三個(gè)(原始數(shù)據(jù),過(guò)程文件梧油,填寫(xiě)信息的表格)
4.滑到下面苫耸,選擇Transfer Files,進(jìn)去后step1是你的絕對(duì)路徑,step2有address儡陨,用戶名和密碼
5.上傳方式選擇(lftp和FileZilla Client)
在服務(wù)區(qū)網(wǎng)速快且穩(wěn)定時(shí)直接conda安裝lftp
lftp user:密碼f@ftp-private.ncbi.nlm.nih.gov
cd到你的文件夾下
mirror -R? 文件夾路徑? ./
放著不動(dòng)等自動(dòng)傳完就行了
如果服務(wù)器網(wǎng)絡(luò)不穩(wěn)定骗村,則推薦使用FileZilla Client
在文件這一欄打開(kāi)站點(diǎn)管理器嫌褪,如圖所示填寫(xiě),連接成功后如果傳輸速度依然很慢胚股,可以在編輯這一欄打開(kāi)設(shè)置笼痛,點(diǎn)擊傳輸,如下設(shè)置
數(shù)據(jù)傳完了,只剩下填表缨伊,表格包含兩張就可摘刑,一張是你實(shí)驗(yàn)的信息,需按照指定格式完整填寫(xiě)刻坊,另一張是raw data和processed data的MD5值枷恕。
6.待所有數(shù)據(jù)上傳完成后,就可以進(jìn)入最后一步谭胚,Notify GEO
然后填入你上傳的文件夾名徐块。如果文章在投或者暫不想公開(kāi)數(shù)據(jù),GEO數(shù)據(jù)可以將你的測(cè)序文件設(shè)為私密(最多3年)漏益,這個(gè)可以自行設(shè)置Release date蛹锰。最后點(diǎn)擊Submit,即完成上傳的所有流程绰疤。釋放時(shí)間無(wú)需擔(dān)心铜犬,文章投刊時(shí)會(huì)釋放出來(lái)。ps:NCBI工作效率還是挺快的轻庆,一兩天就有人回復(fù)癣猾,他們覺(jué)得沒(méi)問(wèn)題后就會(huì)把數(shù)據(jù)存放至另一個(gè)位置,原路徑文件可能會(huì)刪除余爆,數(shù)據(jù)存放兩個(gè)星期也后會(huì)自動(dòng)刪除纷宇。
看到這啦,不妨點(diǎn)個(gè)贊再走吧