CellRanger走起(一)數(shù)據(jù)下載

劉小澤寫于19.5.3

數(shù)據(jù)來自2018年9月的NC文章Acquired cancer resistance to combination immunotherapy from transcriptional loss of class I HLA

文章解讀在:http://www.reibang.com/p/b818e38f7e9c

實驗設計

共有兩名患者:

  • 患者2586-4:

    • The primary patient (2586-4) received hypofractionated radiation for HLA upregulation to some but not all disease sites
    • 利用10X 3' Chromium v2.0平臺建庫 + Hiseq2500 "rapid run"模式 GSE117988
    • discovery tumor部分:After sequence alignment and filtering, 7431 tumor cells (2243 cells before and 5188 cells after T cell therapy)
    • discovery PBMC部分:After sequence alignment and filtering, a total of 12,874 cells were analyzed [其中包含了四個時間點:治療前(Pre)膝但,治療后早期day +27(Early),治療后反應期day+37(Resp),治療后復發(fā)+614 (AR)]
    ID Description
    GSM3330559 Tumor Disc Pre
    GSM3330560 Tumor Disc AR
    GSM3330561 PBMC Pre
    GSM3330562 PBMC Disc Early
    GSM3330563 PBMC Disc Resp
    GSM3330564 PBMC Disc AR
  • 患者9245-3:

    • The second validation patient (9245-3) is a 59-year-old man with metastatic MCC that had initially presented as stage IIIB disease, now metastatic at multiple sites
    • 利用10X 5' V(D)J 進行cell washing, barcoding and library prep+ NovaSeq 6000(gene expression) + Hiseq4000 (V(D)J) GSE118056
    ID Description
    GSM3317833 PBMC Relapse - L001
    GSM3317834 PBMC Relapse - L002
    GSM3317835 Tumor Relapse - L001
    GSM3317836 Tumor Relapse - L002

軟件環(huán)境

原始數(shù)據(jù)一般是以SRR格式存放热某,這個文件一般都要幾個G,于是下載器首選ascp,但是直接使用ascp下載又需要配置一些參數(shù),對于新手來說幽勒,最好是能提供一個ID羽历,然后直接就下載焊虏,這個就需要用到prefetch 與 ascp的組合

prefetch是sratools中的一個小工具,因此直接用conda下載就好

conda install -c daler sratoolkit
prefetch -h # 可以顯示幫助文檔就說明安裝成功
# 如果要下載數(shù)據(jù)比如SRR文件秕磷,直接加ID號诵闭,指定輸出目錄就好
prefetch SRRxxxxxxx -O PATH

默認情況下,prefetch是利用https方式去下載原始數(shù)據(jù),這個就像直接從網(wǎng)頁下載一樣疏尿,速度有一定的限制瘟芝。因此我們需要先安裝一款叫做"aspera"的下載工具,它是IBM旗下的商業(yè)高速文件傳輸軟件润歉,與NCBI和EBI有協(xié)作合同

wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727-linux-64.tar.gz
tar zxvf aspera-connect-3.7.4.147727-linux-64.tar.gz
#安裝
bash aspera-connect-3.7.4.147727-linux-64.sh
# 然后cd到根目錄下看看是不是存在了.aspera文件夾模狭,有的話表示安裝成功
cd && ls -a
# 將aspera軟件加入環(huán)境變量,并激活
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
# 最后檢查ascp是不是能用了
ascp --help

ascp安裝成功后踩衩,prefetch就會默認將下載方式從https轉(zhuǎn)移到fasp嚼鹉,說明開啟加速模式

一般ascp沒有什么問題,出問題主要是:

ascp: Failed to open TCP connection for SSH, exiting.

Session Stop  (Error: Failed to open TCP connection for SSH)

# 官網(wǎng)給出的解決辦法是:https://support.asperasoft.com/hc/en-us/articles/216126918-Error-44-UDP-session-initiation-fatal-error
On many Linux systems the default firewall can be configured with iptables. You will have to allow all incoming and outgoing traffic on UDP port 33001 (or whatever your Aspera UDP port is), which you can do with the following commands:
# 使用下面這兩個命令(但需要管理員權限)
# iptables -I INPUT -p tcp --dport 33001 -j ACCEPT
# iptables -I OUTPUT -p tcp --dport 33001 -j ACCEPT

數(shù)據(jù)下載

以患者2586-4為例驱富,所有數(shù)據(jù)都存放在GEO中

  1. 打開https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE117988
    (這里注意鏈接是有規(guī)律的锚赤,只需要改變最后的ID號就能獲取其他的GEO數(shù)據(jù))

  2. 點擊SRA這里的SRP155988

  3. send to => Run Selector => Go

  4. 下載Accession List,然后就得到了一個文本文件褐鸥,列出了6個SRR ID號


  5. 下載代碼

    wkd=/home/project/single-cell/MCC
    
    cd $wkd/raw
    # for patient 2586-4
    cat >SRR_Acc_List-2586-4.txt
    SRR7722937
    SRR7722938
    SRR7722939
    SRR7722940
    SRR7722941
    SRR7722942
    
    cat SRR_Acc_List-2586-4.txt |while read i
    do prefetch $i -O `pwd` && echo "** ${i}.sra done **"
    done
    # 一般2.6G文件下載2分鐘左右
    
  6. 下載成功會有提示

    2019-xxxxxxxx prefetch.2.9.1:  fasp download succeed
    2019-xxxxxxxx prefetch.2.9.1: 1) 'SRR7722937' was downloaded successfully
    2019-xxxxxxxx prefetch.2.9.1: 'SRR7722937' has 0 unresolved dependencies
    ** SRR7722937.sra done **
    

兩個患者的十個樣本數(shù)據(jù)下載結束后發(fā)現(xiàn)线脚,SRR7722939和SRR7722942下載失敗,看了一下數(shù)據(jù)源叫榕,這兩個數(shù)據(jù)在sra-sos.public這個位置浑侥,而不是在ncbi

于是,可以選擇另一個途徑EBI下載

  1. 進入官網(wǎng)https://www.ebi.ac.uk/ena 晰绎,搜索想下載的SRA號
  2. 選擇SRR這里[或者直接通過https://www.ebi.ac.uk/ena/data/view/SRR7722939修改ID]
  3. EBI有個好處就是可以直接下載fastq格式文件(左邊方框)寓落,如果要下載sra就復制右邊紅色方框中鏈接


  4. 然后利用這個代碼下載
ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/srr/SRR772/009/SRR7722939 ./
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市荞下,隨后出現(xiàn)的幾起案子伶选,更是在濱河造成了極大的恐慌,老刑警劉巖尖昏,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件仰税,死亡現(xiàn)場離奇詭異,居然都是意外死亡抽诉,警方通過查閱死者的電腦和手機陨簇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來迹淌,“玉大人河绽,你說我怎么就攤上這事∥∩常” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵荷鼠,是天一觀的道長句携。 經(jīng)常有香客問我,道長允乐,這世上最難降的妖魔是什么矮嫉? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任削咆,我火速辦了婚禮,結果婚禮上蠢笋,老公的妹妹穿的比我還像新娘拨齐。我一直安慰自己,他們只是感情好昨寞,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布瞻惋。 她就那樣靜靜地躺著,像睡著了一般援岩。 火紅的嫁衣襯著肌膚如雪歼狼。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天享怀,我揣著相機與錄音羽峰,去河邊找鬼。 笑死添瓷,一個胖子當著我的面吹牛梅屉,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播鳞贷,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼坯汤,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了悄晃?” 一聲冷哼從身側響起玫霎,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎妈橄,沒想到半個月后庶近,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡眷蚓,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年鼻种,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片沙热。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡叉钥,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出篙贸,到底是詐尸還是另有隱情投队,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布爵川,位于F島的核電站敷鸦,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜扒披,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一值依、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧碟案,春花似錦愿险、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至熔任,卻和暖如春褒链,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背疑苔。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工甫匹, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人惦费。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓兵迅,卻偏偏與公主長得像,于是被迫代替她去往敵國和親薪贫。 傳聞我的和親對象是個殘疾皇子恍箭,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353