要是有g(shù)dc-client軟件下載數(shù)據(jù),需要以下三步才能完成:
1从媚、GDC篩選檢索下載需要數(shù)據(jù)的Manifest文件
TCGA改版后烹植,下載方式變得大為不同,數(shù)據(jù)都整合在GDC(Genomic Data Commons)的DATA PORTAL中刻帚,網(wǎng)址:https://portal.gdc.cancer.gov/
建議大家先從Exploration頁面篩選數(shù)據(jù)再到Repository頁面篩選,最后下載Manifest文件涩嚣,這里以乳腺癌表達(dá)數(shù)據(jù)Manifest文件下載為例給大家說明:
1)Exploration:在頁面右邊勾選自己想要的數(shù)據(jù)崇众,然后點(diǎn)擊 view Files in Repository,跳轉(zhuǎn)到Repository頁面進(jìn)一步篩選.
2)Repository:在頁面選項(xiàng)卡選擇自己需要的數(shù)據(jù)航厚,然后點(diǎn)擊Manifest下載:
2顷歌、gdc-client軟件安裝和配置
1)下載軟件地址:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool,根據(jù)自己的操作系統(tǒng)下載對(duì)應(yīng)的版本幔睬,這里下載windows版本衙吩。
2)將下載的軟件解壓,并放在一個(gè)自己好找的目錄溪窒,例如我放在D:\TCGA目錄,并且把上面下載的Manifest文件也放在相同的文件夾:
3冯勉、使用gdc-client下載TCGA數(shù)據(jù)
1)方法澈蚌,打開windows的dos窗口,并切換到剛才的目錄:D:\TCGA
方法2灼狰,將gdc-client.exe 文件所在的目錄添加到windows環(huán)境變量中宛瞄,方便命令行調(diào)用:
這個(gè)軟件加入環(huán)境變量,如果以后想在任何一個(gè)路徑簡單使用gdc-client這個(gè)命令,那就需要把這個(gè)軟件的路徑加到環(huán)境變量份汗。就是在Path加入剛剛軟件所在的路徑即可”盈电。具體操作如下:打開電腦控制面板->系統(tǒng)和安全->系統(tǒng)->高級(jí)系統(tǒng)設(shè)置->環(huán)境變量->Path->“加入你的gdc-client所在路徑” ,然后應(yīng)用保存杯活。
系統(tǒng)和安全
系統(tǒng)
高級(jí)系統(tǒng)設(shè)置
環(huán)境變量? 編輯Path
Path添加:
由于gdc-client軟件只能幫我們下載數(shù)據(jù)匆帚,數(shù)據(jù)的整理合并篩選等需要我們手動(dòng)完成(借助perl或者python整理)。如果有R語言基礎(chǔ)旁钧,這里推薦大家使用TCGAbiolinks下載整理數(shù)據(jù):https://www.omicsclass.com/article/1060
更多生物信息課程:
1. 文章越來越難發(fā)吸重?是你沒發(fā)現(xiàn)新思路,基因家族分析發(fā)2-4分文章簡單快速歪今,學(xué)習(xí)鏈接:基因家族分析實(shí)操課程、基因家族文獻(xiàn)思路解讀
2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入寄猩?圖表看不懂?點(diǎn)擊鏈接學(xué)習(xí)深入解讀數(shù)據(jù)結(jié)果文件田篇,學(xué)習(xí)鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀;轉(zhuǎn)錄組(無參)結(jié)果解讀
3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA斯辰,提升你的文章檔次舶担,學(xué)習(xí)鏈接:WGCNA-加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析
4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘?學(xué)習(xí)鏈接:轉(zhuǎn)錄組標(biāo)準(zhǔn)分析后的數(shù)據(jù)挖掘彬呻、轉(zhuǎn)錄組文獻(xiàn)解讀
5.微生物16S/ITS/18S分析原理及結(jié)果解讀、OTU網(wǎng)絡(luò)圖繪制闸氮、cytoscape與網(wǎng)絡(luò)圖繪制課程
6. 生物信息入門到精通必修基礎(chǔ)課,學(xué)習(xí)鏈接:linux系統(tǒng)使用蒲跨、perl入門到精通译断、perl語言高級(jí)、R語言畫圖
7. 醫(yī)學(xué)相關(guān)數(shù)據(jù)挖掘課程或悲,不用做實(shí)驗(yàn)也能發(fā)文章,學(xué)習(xí)鏈接:TCGA-差異基因分析巡语、GEO芯片數(shù)據(jù)挖掘、GSEA富集分析課程男公、TCGA臨床數(shù)據(jù)生存分析、TCGA-轉(zhuǎn)錄因子分析、TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析
8.其他課程鏈接:二代測序轉(zhuǎn)錄組數(shù)據(jù)自主分析拥知、NCBI數(shù)據(jù)上傳碎赢、二代測序數(shù)據(jù)解讀低剔。