# BiocManager::install("BioinformaticsFMRP/TCGAbiolinksGUI.data")
# BiocManager::install("BioinformaticsFMRP/TCGAbiolinks")
gdcdata=function(i){
library(TCGAbiolinks)
projects <- getGDCprojects()
library(dplyr)
projects <- projects %>%
as.data.frame() %>%
select(project_id,tumor) %>%
filter(grepl(pattern="TCGA",project_id))
## 0.運行信息
print(paste0("Downloading number ",i,",project name: ",projects$project_id[i]))
## 1.查詢信息
query.exp = GDCquery(project = projects$project_id[i],
data.category = "Transcriptome Profiling",
data.type = "Gene Expression Quantification",
workflow.type = "STAR - Counts")
## 2.正式下載
GDCdownload(query.exp)
## 3.多個數(shù)據(jù)合并
pre.exp = GDCprepare(query = query.exp)
## 4.提取表達(dá)量數(shù)據(jù)
library(SummarizedExperiment)
countsdata = SummarizedExperiment::assay(pre.exp,1)
fpkmdata=SummarizedExperiment::assay(pre.exp,5)
tpmdata=SummarizedExperiment::assay(pre.exp,4)
gene_id=data.frame(id=rowData(pre.exp)@listData[["gene_id"]], gene_name= rowData(pre.exp)@listData[["gene_name"]],gene_type=rowData(pre.exp)@listData[["gene_type"]])
counts=cbind(gene_id,countsdata)
fpkm=cbind(gene_id,fpkmdata)
tpm=cbind(gene_id,tpmdata)
#臨床信息
clinical <- GDCquery_clinic(project = projects$project_id[i], type = "clinical")
## 5.保存數(shù)據(jù)
filename1 = paste0("result/",projects$project_id[i],"-counts.txt")
filename2 = paste0("result/",projects$project_id[i],"-fpkm.txt")
filename3 = paste0("result/",projects$project_id[i],"-tpm.txt")
filename4 = paste0("result/",projects$project_id[i],"-clinical.txt")
write.table(counts,filename1,sep="\t",col.names=T,row.names=F,quote=F)
write.table(fpkm,filename2,sep="\t",col.names=T,row.names=F,quote=F)
write.table(tpm,filename3,sep="\t",col.names=T,row.names=F,quote=F)
write.table(clinical,filename4,sep="\t",col.names=T,row.names=F,quote=F)
}
dir.create("result")
for (i in 1:33) {
gdcdata(i)
}
2022新版TCGA批量下載表達(dá)矩陣及臨床信息
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
- 文/潘曉璐 我一進(jìn)店門贰军,熙熙樓的掌柜王于貴愁眉苦臉地迎上來玻蝌,“玉大人,你說我怎么就攤上這事词疼≡钜粒” “怎么了?”我有些...
- 文/不壞的土叔 我叫張陵寒跳,是天一觀的道長。 經(jīng)常有香客問我竹椒,道長童太,這世上最難降的妖魔是什么? 我笑而不...
- 正文 為了忘掉前任胸完,我火速辦了婚禮书释,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘赊窥。我一直安慰自己爆惧,他們只是感情好,可當(dāng)我...
- 文/花漫 我一把揭開白布锨能。 她就那樣靜靜地躺著扯再,像睡著了一般。 火紅的嫁衣襯著肌膚如雪址遇。 梳的紋絲不亂的頭發(fā)上熄阻,一...
- 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼吏恭!你這毒婦竟也來了拗小?” 一聲冷哼從身側(cè)響起,我...
- 正文 年R本政府宣布宿亡,位于F島的核電站,受9級特大地震影響纳令,放射性物質(zhì)發(fā)生泄漏挽荠。R本人自食惡果不足惜,卻給世界環(huán)境...
- 文/蒙蒙 一平绩、第九天 我趴在偏房一處隱蔽的房頂上張望圈匆。 院中可真熱鬧,春花似錦捏雌、人聲如沸跃赚。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽领猾。三九已至摔竿,卻和暖如春继低,著一層夾襖步出監(jiān)牢的瞬間袁翁,已是汗流浹背。 一陣腳步聲響...
推薦閱讀更多精彩內(nèi)容
- 主要想介紹的是下載下來數(shù)據(jù)的數(shù)據(jù)處理這一塊得院,不是特別建議RTCGA的下載方法祥绞,列出了是因為怕沒有源文件后續(xù)數(shù)據(jù)處理...
- xml文件 count文件 count樣子 每個count文件行名一致 得到 無列名 尋找列名 清空購物車 下載...
- 0.背景 關(guān)于樣本id和分組信息:TCGA的樣本id里藏著分組信息[https://mp.weixin.qq.co...
- 時光小屋批量備份梦染,請看圖片帕识。 “時光小屋是一個供家人上傳和分享孩子照片的私密共享相冊肮疗,主要以手機(jī) APP 形式使用...
- TCGA數(shù)據(jù)庫在2022年4月初進(jìn)行更新之后珠增,小編第一時間給大家展示了TCGA數(shù)據(jù)庫的變化蒂教,用圖文的方式詳細(xì)介紹了...