為發(fā)表論文故删窒,測序數(shù)據(jù)一般需要上傳至公共數(shù)據(jù)庫,對我們而言颠毙,國外數(shù)據(jù)庫一般選NCBI斯入,國內的可上傳至GSA。其中蛀蜜,人遺數(shù)據(jù)需要上傳到GSA-human刻两,其他物種數(shù)據(jù)上傳到GSA即可。
自從2019年國家出臺了人遺資源相關的條規(guī)后滴某,所有上傳至公共數(shù)據(jù)庫的人遺資源都需要在科技部備案闹伪。上傳到國內的GSA-human,必須要有備份號和備案號才能釋放數(shù)據(jù)壮池;上傳到NCBI偏瓤,釋放數(shù)據(jù)雖然不需要這兩個編號,但如果被人舉報沒有提前進行備份和備案......可能就不只是一篇文章的事了椰憋。上傳到GSA的數(shù)據(jù)不需要備份或備案厅克,可直接釋放。
本文僅針對人遺數(shù)據(jù)共享橙依,穩(wěn)妥起見(節(jié)省時間)证舟,建議提前上傳數(shù)據(jù)至數(shù)據(jù)庫,生成臨時訪問鏈接后投稿窗骑;同時申請備份號女责,拿到備份號之后才能申請備案號。 下面會具體介紹如何進行備份创译、備案抵知,以及如何上傳數(shù)據(jù)至GSA-human和NCBI。
申請備份號:需提交數(shù)據(jù)
人類遺傳資源信息備份平臺: https://202.108.211.75/ 有時候會提示為不安全鏈接软族,繼續(xù)訪問即可刷喜。個人感覺這一步并沒有“卡“一說,主要目的是將數(shù)據(jù)留存到國家平臺立砸。
時間:大概20天獲得備份號掖疮。
聯(lián)系:電話咨詢,是一位說話溫柔的小姐姐接電話颗祝,很耐心浊闪;郵件溝通恼布,一般第二天就能收到回復,高效搁宾。
基本流程:
-
注冊個人賬戶折汞,這里不需要用PI信息,個人注冊即可猛铅。
證件上傳:(2022.4)新出的要求字支,認證需上傳組織機構代碼證復印件、經(jīng)辦人本人身份證復印件奸忽、法人授權委托書(經(jīng)辦人非法人的情況)堕伪。
經(jīng)辦人本人身份證復印件:經(jīng)辦人指賬號所有人,不是項目負責人栗菜。人遺辦小姐姐說“不同項目可能對應不同的PI欠雌,所以不能認證PI”。
法人授權委托書(經(jīng)辦人非法人的情況):沒有模板疙筹,自行撰寫富俄,蓋單位公章或者法人簽字都可。-
登錄后仔細看”操作指南“
-
點擊“新建項目”:輸入相應信息而咆,項目負責人填課題組負責人霍比。
使用范圍說明:“對外提供”一般指提供給國外團隊(國際合作);發(fā)表文章一般選“開放使用”暴备,開放方式可多選悠瞬,如果需要上傳至公共數(shù)據(jù)庫,同時選“論文發(fā)表”和“信息平臺共享”涯捻。
-
創(chuàng)建后浅妆,會自動跳轉到“項目列表”,點擊“查看”可以看到項目具體信息障癌,點擊”添加“新建備份名稱凌外,點擊“添加文件”后,可以通過“添加待上傳文件”直接通過網(wǎng)頁上傳數(shù)據(jù)涛浙,或通過“添加郵寄文件“上傳數(shù)據(jù)康辑。
添加待上傳文件:通過網(wǎng)頁直接上傳,非常非常慢蝗拿。
添加郵寄文件:需輸入單號晾捏、文件名(硬盤里的文件夾名稱)。強烈建議超過50G的數(shù)據(jù)通過硬盤郵寄方式上傳哀托。一般一周內會上傳完畢(可以每天上來刷一刷,上傳完后會提示文件進度100%)劳秋。硬盤一般不能立即取回仓手,需保留在人遺辦一段時間胖齐,待獲得備案號之后可以寫郵件申請取回硬盤(順豐到付)。硬盤郵寄時嗽冒,需要在里面附上一個紙質說明呀伙,包含以下信息:項目名稱、編號添坊、聯(lián)系人及聯(lián)系方式剿另、需上傳的數(shù)據(jù)。硬盤里僅保留需上傳的數(shù)據(jù)(命名方式為項目名稱-聯(lián)系人及電話贬蛙,如 ABCD測序-fatlady18811111111)雨女,不要同時存儲其他數(shù)據(jù)。
- 一般20天左右可以查詢到備份號(BF開頭的一段字符)(拿出追劇的熱情阳准,每天刷一刷)氛堕,這時候可以寫郵件申請返還硬盤,雖然對方不一定給寄野蝇,但是保持聯(lián)系總是沒錯噠讼稚!獲得備案號后,肯定就能返回硬盤啦绕沈。
申請備案號
科技部政務系統(tǒng)備案: https://fuwu.most.gov.cn/ 填寫材料锐想,需填寫備份號。
時間:大概20天
注意:測序公司最好不要選有外資的企業(yè)乍狐,否則提交是可能被認為是國際合作赠摇,可能無法通過審核。
主要流程:
-
提前準備的材料:論文原文澜躺、法人資格材料
聯(lián)系人寫自己蝉稳;負責人寫PI
-
流程:提交材料——單位科技處審核——科技部安全審查——審核通過,獲得備案號掘鄙;或者被打回耘戚,根據(jù)意見修改(科技部每月開兩次會討論人遺申請)。
數(shù)據(jù)上傳至GSA(國家信息中心操漠、中科院基因組所數(shù)據(jù)中心 )
人遺的數(shù)據(jù)提交到GSA-human https://bigd.big.ac.cn/gsa-human/收津;其他數(shù)據(jù)提交到GSA即可。
必須用PI郵箱注冊浊伙,通過審核后用PI郵箱登錄操作(提交數(shù)據(jù)等)撞秋,可以將聯(lián)系人設置為自己,這樣有任何問題工作人員會直接找聯(lián)系人嚣鄙。
聯(lián)系:加入QQ群吻贿,回復率較高,如未及時回復哑子,私聊工作人員即可舅列。
上傳:從官網(wǎng)下載最新的手冊肌割,通過FTP上傳文件(最高可達8M/s),太大可通過郵寄上傳帐要。
將數(shù)據(jù)設置為公開訪問(開放時間設置好把敞,之后可修改延后)。
數(shù)據(jù)公開(共享)需要過審:要求有人遺辦的備份號榨惠、科技部的備案號奋早。
僅支持部分雜志:https://bigd.big.ac.cn/gsa/statistics?active=articles
All sequencing reads have been deposited in the Genome Sequence Archive in National Genomics Data Center, China National Center for Bioinformation / Beijing Institute of Genomics, Chinese Academy of Sciences, under accession number HRA000684 (http://bigd.big.ac.cn/gsa-human/s/3kUd5023) .
數(shù)據(jù)上傳至NCBI
原始測序數(shù)據(jù)(fastq)一般提交到SRA https://www.ncbi.nlm.nih.gov/sra/docs/submitportal/,具體根據(jù)流程來就行赠橙。不超過50G的數(shù)據(jù)可以通過FTP直接上傳耽装,目前我所在單位有線網(wǎng)絡上傳速度為~800Kb/s,數(shù)據(jù)不多時尚可接受简烤。勝在有可視化頁面剂邮、操作便捷。超過50G的數(shù)據(jù)横侦,建議通過服務器用aspera上傳挥萌,勝在穩(wěn)定(如果網(wǎng)絡不斷,基本不會中途中斷)枉侧。
Note:人遺數(shù)據(jù)如果想設置為controlled access引瀑,需要上傳至dbGAP。
FTP上傳
下載filezilla
輸入主機榨馁、用戶名憨栽、密碼(NCBI提供的三個)。此時總是出現(xiàn)響應
550 permission denied
錯誤翼虫。不用管它屑柔,直接輸入NCBI給的目錄點開自己的本地站點目錄。右鍵文件上傳珍剑,上傳后注意檢查文件大小掸宛,有時網(wǎng)絡中斷導致文件上傳不完整,需要重新上傳(親測無法續(xù)傳)招拙。
上傳完后關閉filezilla即可唧瘾。
aspera命令行上傳[網(wǎng)上搜得攻略,未實操]
下載aspera connect軟件安裝
開始菜單搜索cmd别凤,打開
打開顯示C:\Windows\system32饰序,光標一直在后面,重啟下一行還是规哪。所以之后加一個 cd D:/求豫,切換到存儲aspera的那個盤(此處要搜索aspera安裝在哪里,找到bin文件夾),切換到子文件夾目錄注祖,直接接子文件夾目錄名
-
用cd命令切換到aspera connect\bin5. 完成后輸入NCBI讓輸入的命令行猾蒂,
ascp -i <path/to/key_file> -QT -l100m -k1 -d <path/to/folder/containing files>subasp@upload.ncbi.nlm.nih.gov:uploads/xxxx
中間不用另起一行均唉,直接接著文件夾名后輸入l100m中的l是小寫的L(這個嘗試了好久)輸入完成后回車是晨,文件即自動上傳。
廢棄選項:國家人口健康科學數(shù)據(jù)中心
國家人口健康科學數(shù)據(jù)中心 (中國醫(yī)學科學院生物醫(yī)學大數(shù)據(jù)中心)https://www.ncmi.cn/phda/submit.html
2017年成立舔箭,到現(xiàn)在仍然是個鳥樣罩缴。英文版竟然還沒有上線。
“其他來源數(shù)據(jù)匯交”:提交數(shù)據(jù)层扶,可設置公開時間和共享方式(如協(xié)議共享)箫章。