人遺測序數(shù)據(jù)的備份備案及共享

為發(fā)表論文故删窒,測序數(shù)據(jù)一般需要上傳至公共數(shù)據(jù)庫,對我們而言颠毙,國外數(shù)據(jù)庫一般選NCBI斯入,國內的可上傳至GSA。其中蛀蜜,人遺數(shù)據(jù)需要上傳到GSA-human刻两,其他物種數(shù)據(jù)上傳到GSA即可。

自從2019年國家出臺了人遺資源相關的條規(guī)后滴某,所有上傳至公共數(shù)據(jù)庫的人遺資源都需要在科技部備案闹伪。上傳到國內的GSA-human,必須要有備份號和備案號才能釋放數(shù)據(jù)壮池;上傳到NCBI偏瓤,釋放數(shù)據(jù)雖然不需要這兩個編號,但如果被人舉報沒有提前進行備份和備案......可能就不只是一篇文章的事了椰憋。上傳到GSA的數(shù)據(jù)不需要備份或備案厅克,可直接釋放。

本文僅針對人遺數(shù)據(jù)共享橙依,穩(wěn)妥起見(節(jié)省時間)证舟,建議提前上傳數(shù)據(jù)至數(shù)據(jù)庫,生成臨時訪問鏈接后投稿窗骑;同時申請備份號女责,拿到備份號之后才能申請備案號。 下面會具體介紹如何進行備份创译、備案抵知,以及如何上傳數(shù)據(jù)至GSA-human和NCBI。

申請備份號:需提交數(shù)據(jù)

人類遺傳資源信息備份平臺: https://202.108.211.75/ 有時候會提示為不安全鏈接软族,繼續(xù)訪問即可刷喜。個人感覺這一步并沒有“卡“一說,主要目的是將數(shù)據(jù)留存到國家平臺立砸。

時間:大概20天獲得備份號掖疮。

聯(lián)系:電話咨詢,是一位說話溫柔的小姐姐接電話颗祝,很耐心浊闪;郵件溝通恼布,一般第二天就能收到回復,高效搁宾。

基本流程:

  • 注冊個人賬戶折汞,這里不需要用PI信息,個人注冊即可猛铅。


    注冊賬戶
  • 證件上傳:(2022.4)新出的要求字支,認證需上傳組織機構代碼證復印件、經(jīng)辦人本人身份證復印件奸忽、法人授權委托書(經(jīng)辦人非法人的情況)堕伪。
    經(jīng)辦人本人身份證復印件:經(jīng)辦人指賬號所有人,不是項目負責人栗菜。人遺辦小姐姐說“不同項目可能對應不同的PI欠雌,所以不能認證PI”。
    法人授權委托書(經(jīng)辦人非法人的情況):沒有模板疙筹,自行撰寫富俄,蓋單位公章或者法人簽字都可。

  • 登錄后仔細看”操作指南“


    操作指南
  • 點擊“新建項目”:輸入相應信息而咆,項目負責人填課題組負責人霍比。


    創(chuàng)建項目

使用范圍說明:“對外提供”一般指提供給國外團隊(國際合作);發(fā)表文章一般選“開放使用”暴备,開放方式可多選悠瞬,如果需要上傳至公共數(shù)據(jù)庫,同時選“論文發(fā)表”和“信息平臺共享”涯捻。


開放方式
  • 創(chuàng)建后浅妆,會自動跳轉到“項目列表”,點擊“查看”可以看到項目具體信息障癌,點擊”添加“新建備份名稱凌外,點擊“添加文件”后,可以通過“添加待上傳文件”直接通過網(wǎng)頁上傳數(shù)據(jù)涛浙,或通過“添加郵寄文件“上傳數(shù)據(jù)康辑。


    項目列表




添加待上傳文件:通過網(wǎng)頁直接上傳,非常非常慢蝗拿。



添加郵寄文件:需輸入單號晾捏、文件名(硬盤里的文件夾名稱)。強烈建議超過50G的數(shù)據(jù)通過硬盤郵寄方式上傳哀托。一般一周內會上傳完畢(可以每天上來刷一刷,上傳完后會提示文件進度100%)劳秋。硬盤一般不能立即取回仓手,需保留在人遺辦一段時間胖齐,待獲得備案號之后可以寫郵件申請取回硬盤(順豐到付)。硬盤郵寄時嗽冒,需要在里面附上一個紙質說明呀伙,包含以下信息:項目名稱、編號添坊、聯(lián)系人及聯(lián)系方式剿另、需上傳的數(shù)據(jù)。硬盤里僅保留需上傳的數(shù)據(jù)(命名方式為項目名稱-聯(lián)系人及電話贬蛙,如 ABCD測序-fatlady18811111111)雨女,不要同時存儲其他數(shù)據(jù)。

  • 一般20天左右可以查詢到備份號(BF開頭的一段字符)(拿出追劇的熱情阳准,每天刷一刷)氛堕,這時候可以寫郵件申請返還硬盤,雖然對方不一定給寄野蝇,但是保持聯(lián)系總是沒錯噠讼稚!獲得備案號后,肯定就能返回硬盤啦绕沈。

申請備案號

科技部政務系統(tǒng)備案: https://fuwu.most.gov.cn/ 填寫材料锐想,需填寫備份號。
時間:大概20天
注意:測序公司最好不要選有外資的企業(yè)乍狐,否則提交是可能被認為是國際合作赠摇,可能無法通過審核。

主要流程:

  • 提前準備的材料:論文原文澜躺、法人資格材料


    需提前備好
  • 聯(lián)系人寫自己蝉稳;負責人寫PI

  • 流程:提交材料——單位科技處審核——科技部安全審查——審核通過,獲得備案號掘鄙;或者被打回耘戚,根據(jù)意見修改(科技部每月開兩次會討論人遺申請)。


    下載蓋章后提交

    獲得備案號

數(shù)據(jù)上傳至GSA(國家信息中心操漠、中科院基因組所數(shù)據(jù)中心 )

人遺的數(shù)據(jù)提交到GSA-human https://bigd.big.ac.cn/gsa-human/收津;其他數(shù)據(jù)提交到GSA即可。

  • 必須用PI郵箱注冊浊伙,通過審核后用PI郵箱登錄操作(提交數(shù)據(jù)等)撞秋,可以將聯(lián)系人設置為自己,這樣有任何問題工作人員會直接找聯(lián)系人嚣鄙。

  • 聯(lián)系:加入QQ群吻贿,回復率較高,如未及時回復哑子,私聊工作人員即可舅列。

  • 上傳:從官網(wǎng)下載最新的手冊肌割,通過FTP上傳文件(最高可達8M/s),太大可通過郵寄上傳帐要。

  • 將數(shù)據(jù)設置為公開訪問(開放時間設置好把敞,之后可修改延后)。

  • 數(shù)據(jù)公開(共享)需要過審:要求有人遺辦的備份號榨惠、科技部的備案號奋早。

  • 僅支持部分雜志:https://bigd.big.ac.cn/gsa/statistics?active=articles

  • All sequencing reads have been deposited in the Genome Sequence Archive in National Genomics Data Center, China National Center for Bioinformation / Beijing Institute of Genomics, Chinese Academy of Sciences, under accession number HRA000684 (http://bigd.big.ac.cn/gsa-human/s/3kUd5023) .

數(shù)據(jù)上傳至NCBI

原始測序數(shù)據(jù)(fastq)一般提交到SRA https://www.ncbi.nlm.nih.gov/sra/docs/submitportal/,具體根據(jù)流程來就行赠橙。不超過50G的數(shù)據(jù)可以通過FTP直接上傳耽装,目前我所在單位有線網(wǎng)絡上傳速度為~800Kb/s,數(shù)據(jù)不多時尚可接受简烤。勝在有可視化頁面剂邮、操作便捷。超過50G的數(shù)據(jù)横侦,建議通過服務器用aspera上傳挥萌,勝在穩(wěn)定(如果網(wǎng)絡不斷,基本不會中途中斷)枉侧。

Note:人遺數(shù)據(jù)如果想設置為controlled access引瀑,需要上傳至dbGAP。

FTP上傳

  1. 下載filezilla

  2. 輸入主機榨馁、用戶名憨栽、密碼(NCBI提供的三個)。此時總是出現(xiàn)響應 550 permission denied 錯誤翼虫。不用管它屑柔,直接輸入NCBI給的目錄點開自己的本地站點目錄。

  3. 右鍵文件上傳珍剑,上傳后注意檢查文件大小掸宛,有時網(wǎng)絡中斷導致文件上傳不完整,需要重新上傳(親測無法續(xù)傳)招拙。

  4. 上傳完后關閉filezilla即可唧瘾。

aspera命令行上傳[網(wǎng)上搜得攻略,未實操]

  1. 下載aspera connect軟件安裝

  2. 開始菜單搜索cmd别凤,打開

  3. 打開顯示C:\Windows\system32饰序,光標一直在后面,重啟下一行還是规哪。所以之后加一個 cd D:/求豫,切換到存儲aspera的那個盤(此處要搜索aspera安裝在哪里,找到bin文件夾),切換到子文件夾目錄注祖,直接接子文件夾目錄名

  4. 用cd命令切換到aspera connect\bin5. 完成后輸入NCBI讓輸入的命令行猾蒂,

    ascp -i <path/to/key_file> -QT -l100m -k1 -d <path/to/folder/containing files>subasp@upload.ncbi.nlm.nih.gov:uploads/xxxx

    中間不用另起一行均唉,直接接著文件夾名后輸入l100m中的l是小寫的L(這個嘗試了好久)輸入完成后回車是晨,文件即自動上傳。

廢棄選項:國家人口健康科學數(shù)據(jù)中心

國家人口健康科學數(shù)據(jù)中心 (中國醫(yī)學科學院生物醫(yī)學大數(shù)據(jù)中心)https://www.ncmi.cn/phda/submit.html

2017年成立舔箭,到現(xiàn)在仍然是個鳥樣罩缴。英文版竟然還沒有上線。

“其他來源數(shù)據(jù)匯交”:提交數(shù)據(jù)层扶,可設置公開時間和共享方式(如協(xié)議共享)箫章。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市镜会,隨后出現(xiàn)的幾起案子檬寂,更是在濱河造成了極大的恐慌,老刑警劉巖戳表,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件桶至,死亡現(xiàn)場離奇詭異,居然都是意外死亡匾旭,警方通過查閱死者的電腦和手機镣屹,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來价涝,“玉大人女蜈,你說我怎么就攤上這事∩瘢” “怎么了伪窖?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長居兆。 經(jīng)常有香客問我覆山,道長,這世上最難降的妖魔是什么史辙? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任汹买,我火速辦了婚禮,結果婚禮上聊倔,老公的妹妹穿的比我還像新娘晦毙。我一直安慰自己,他們只是感情好耙蔑,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布见妒。 她就那樣靜靜地躺著,像睡著了一般甸陌。 火紅的嫁衣襯著肌膚如雪须揣。 梳的紋絲不亂的頭發(fā)上盐股,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音耻卡,去河邊找鬼疯汁。 笑死,一個胖子當著我的面吹牛卵酪,可吹牛的內容都是我干的幌蚊。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼溃卡,長吁一口氣:“原來是場噩夢啊……” “哼溢豆!你這毒婦竟也來了?” 一聲冷哼從身側響起瘸羡,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤漩仙,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后犹赖,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體队他,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年冷尉,在試婚紗的時候發(fā)現(xiàn)自己被綠了漱挎。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡雀哨,死狀恐怖磕谅,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情雾棺,我是刑警寧澤膊夹,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站捌浩,受9級特大地震影響放刨,放射性物質發(fā)生泄漏。R本人自食惡果不足惜尸饺,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一进统、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧浪听,春花似錦螟碎、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春酥郭,著一層夾襖步出監(jiān)牢的瞬間华坦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工不从, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留惜姐,地道東北人。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓消返,卻偏偏與公主長得像载弄,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子撵颊,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內容