TCGA(The Cancer Genome Atlas, 癌癥基因組圖譜侠鳄,https://portal.gdc.cancer.gov/)是美國(guó)國(guó)家癌癥研究所(National Cancer Institute)和美國(guó)人類基因組研究所(National Human Genome Research Institute)共同監(jiān)督的一個(gè)項(xiàng)目勺馆,旨在應(yīng)用高通量的基因組分析技術(shù)葡粒,以幫助人們對(duì)癌癥有個(gè)更好的認(rèn)知雁竞,從而提高對(duì)于癌癥的預(yù)防纽窟、診斷和治療能力酒来。
截止2020年1月13日啡浊,TCGA里面一共收錄了63個(gè)癌癥相關(guān)項(xiàng)目猾昆,那么有人不禁要問了陶因,如何獲取這63個(gè)癌癥項(xiàng)目的具體項(xiàng)目編號(hào)和名稱。今天我們就來(lái)聊一聊垂蜗。
上圖就是從TCGA官網(wǎng)截取的楷扬,顯示目前一共有63個(gè)項(xiàng)目√可以點(diǎn)擊箭頭所指的Projects烘苹,獲取具體63個(gè)癌癥項(xiàng)目的名稱,如下圖所示片部。
除了從官網(wǎng)直接下載以外镣衡,我們也可以用R代碼來(lái)獲取。用到的還是我們前面用來(lái)獲取臨床信息的那個(gè)R包,TCGAbiolinks廊鸥。TCGAbiolinks獲取癌癥臨床信息
if (!requireNamespace("BiocManager", quietly=TRUE)){
install.packages("BiocManager")
}
BiocManager::install("TCGAbiolinks")
library(TCGAbiolinks)
projects=getGDCprojects()
write.csv(file="projects.csv",cbind(projects[8:9]),row.names=F)
通過(guò)這段代碼望浩,我們可以將獲取到63個(gè)項(xiàng)目的信息,保存到本地的projects.csv這個(gè)文件中黍图,然后用Excel打開查看曾雕。具體信息如下: