數(shù)據(jù)下載專題 | UCSC
- UCSC Xena是由加州大學(xué)圣克魯茲分校(University Of Cingifornia Sisha Cruz凿试,UCSC)維護的數(shù)據(jù)庫,前身是癌癥基因組瀏覽器Cancer Browser ,Cancer Browser目前已經(jīng)不再更新.
UCSC 官方網(wǎng)址:UCSC Xena
Xena收錄了TCGA褐鸥、GDC线脚、ICGC、TARGET等多個數(shù)據(jù)庫的公共數(shù)據(jù),主頁如下:
紅框1- Analysis 列出了Xena支持的數(shù)據(jù)分析功能
數(shù)據(jù)下載
方法一
紅框2- 點擊Launch Xene 即可進入數(shù)據(jù)下載界面
箭頭指向的是右邊所有勾選的data hub中的存儲的數(shù)據(jù)浑侥,有122組姊舵,1534個數(shù)據(jù)集,可通過勾選自由選擇想要查看的數(shù)據(jù)平臺的數(shù)據(jù)寓落。以 COAD 為例:
包含:copy number (gene-level)括丁、copy number segments、DNA methylation伶选、exon expression RNAseq史飞、gene expression array、gene expression RNAseq等多個層面的數(shù)據(jù)仰税,
比如 gene expression RNAseq构资,下面對應(yīng)四種數(shù)據(jù)集,區(qū)別在于使用的實驗平臺或是對數(shù)據(jù)的處理方法陨簇,具體介紹可點擊方框里的鏈接查看
進去 IlluminaHiSeq, 界面如下:
綠色方框 對應(yīng)著.json的格式文件吐绵,可以自行打開查看
藍色方框 對應(yīng)著下載的數(shù)據(jù)的 基因名 和 樣本名 ,如下
黃色方框 的鏈接河绽,進入 NCI(National Cancer Institue) 己单,which is part of the National Institutes of Health(NIH).
下載的數(shù)據(jù)形式
1、從上圖鏈接下載對應(yīng)的gene mapping數(shù)據(jù)打開如下:
2耙饰、COAD 的gene expression下載完成后纹笼,打開如下:
其他
幫助文檔中給出了其他的下載方法數(shù)據(jù)下載
數(shù)據(jù)的可視化分析
"VISUALIZATION" 對應(yīng)著UCSC Xena 的可視化分析,
可以發(fā)現(xiàn)通過移動鼠標榔幸,可以觀察每個樣本和對應(yīng)探針的屬性,按住鼠標拖動(橫或豎)矮嫉,可以進行縮放削咆。點擊clear zoom 取消全部縮放, zoom out 撤回上一步縮放蠢笋。當鼠標放在圖片上拨齐,可以發(fā)現(xiàn)右下角有個三角,可以拖動進行放大昨寞。
MGMT介紹: 化療是治療癌癥的重要步驟之一瞻惋,腫瘤對化療的耐受是影響化療結(jié)果的重要因素之一。DNA修復(fù)酶--O6-甲基鳥嘌呤DNA甲基轉(zhuǎn)移酶(O6-methylguanine-DNA methytransferase援岩,MGMT)在膠質(zhì)瘤組織中的表達與腫瘤的耐藥性相關(guān)歼狼,且MGMT基因啟動子的甲基化狀態(tài)是決定MGMT表達量的主要因素,并可能影響病人的化療效果及其預(yù)后享怀。
當我們自己想對某一數(shù)據(jù)集進行可視化分析:https://xenabrowser.net/heatmap/
注 當我們添加數(shù)據(jù)時至少添加兩列才可以進行分析羽峰,因為Xena的設(shè)計,需要有超過2種數(shù)據(jù)類型才能找到變化趨勢。
添加自己的 data 到 Xena
如果以后需要將自己的數(shù)據(jù)添加到Xena中進行分析梅屉,可通過Xena提供的幫助文檔值纱,進行操作
https://ucsc-xena.gitbook.io/project/local-xena-hub/getting-started
學(xué)習(xí)視頻
Xena 中提供了視頻教學(xué):https://ucsc-xena.gitbook.io/project/tutorials