TCGA數(shù)據(jù)庫 | 臨床數(shù)據(jù)不僅僅只有clinical.tsv

其實經(jīng)常分析TCGA數(shù)據(jù)庫時會發(fā)現(xiàn)至会,clinical.tsv中基本沒什么可用信息叛薯,大部分數(shù)據(jù)都是缺失的,那么依啰,如何獲取比較全面的臨床數(shù)據(jù)乎串,有哪些常用方法和數(shù)據(jù)庫店枣,一塊來看看吧~

官網(wǎng)地址: https://portal.gdc.cancer.gov/

0. 對比兩種結果的信息密度

在正式分析之前速警,可以先整體感受一下二者的信息量差距

因為數(shù)據(jù)比較多,因此我把表格縮小了來看鸯两,如clinical.tsv所示闷旧,中間比較空白的地方記錄的都是“-”,即缺失值钧唐,clinical.tsv中雖然term比較多忙灼,但除了少部分預后信息之外,記錄的臨床信息非常的少钝侠,不利于后續(xù)進一步分析

image

再看看使用本期R腳本分析的結果该园,結果非常豐富,記錄也十分詳細帅韧,基本沒有缺失值

image

1. 下載臨床數(shù)據(jù)

總共分為以下4步:

  1. Cases選擇感興趣的數(shù)據(jù)集
  2. File中選擇clinical
  3. 加入購物車
  4. 下載購物車中的文件
    image

2. 提取臨床信息

文末提供整個Rproject文件夾

  1. 把上一步下載的壓縮文件解壓到./TCGA_clinical/file位置

    image

  2. 運行./TCGA_clinical中的code.R里初,什么都不需要修改! 輸出的TCGA_cli.xls即為結果

library(XML)
library(dplyr)

file_char<-list.files(pattern = ".xml",full.names = T,recursive = T)
tem <- xmlParse(file_char[i])%>%xmlToDataFrame()
output_df <- matrix(nrow = length(file_char),
                    ncol = ncol(tem),
                    dimnames = list(NULL,
                                    colnames(tem)))
rm(tem)
for (i in 1:length(file_char)) {
  cli_data <- xmlParse(file_char[i])
  cli_frame <- xmlToDataFrame(cli_data)
  cli_frame[1,c(!is.na(cli_frame[2,]))]<-cli_frame[2,c(!is.na(cli_frame[2,]))]
  output_df[i,]<-as.character(cli_frame[1,])
}
write.table(output_df,file = "TCGA_cli.xls",sep = "\t",row.names = F,col.names = T)

整個Rproject私信提供

感謝觀看忽舟,如果有用還請點贊双妨,收藏,轉發(fā)叮阅!

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末刁品,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子浩姥,更是在濱河造成了極大的恐慌挑随,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件勒叠,死亡現(xiàn)場離奇詭異兜挨,居然都是意外死亡,警方通過查閱死者的電腦和手機缴饭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門暑劝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人颗搂,你說我怎么就攤上這事担猛。” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵傅联,是天一觀的道長先改。 經(jīng)常有香客問我,道長蒸走,這世上最難降的妖魔是什么仇奶? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮比驻,結果婚禮上该溯,老公的妹妹穿的比我還像新娘。我一直安慰自己别惦,他們只是感情好狈茉,可當我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著掸掸,像睡著了一般氯庆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上扰付,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天堤撵,我揣著相機與錄音,去河邊找鬼羽莺。 笑死实昨,一個胖子當著我的面吹牛,可吹牛的內容都是我干的禽翼。 我是一名探鬼主播屠橄,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼闰挡!你這毒婦竟也來了锐墙?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤长酗,失蹤者是張志新(化名)和其女友劉穎溪北,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體夺脾,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡之拨,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了咧叭。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蚀乔。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖菲茬,靈堂內的尸體忽然破棺而出吉挣,到底是詐尸還是另有隱情派撕,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布睬魂,位于F島的核電站终吼,受9級特大地震影響,放射性物質發(fā)生泄漏氯哮。R本人自食惡果不足惜际跪,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望喉钢。 院中可真熱鬧姆打,春花似錦、人聲如沸出牧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽舔痕。三九已至,卻和暖如春豹缀,著一層夾襖步出監(jiān)牢的瞬間伯复,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工邢笙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留啸如,地道東北人。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓氮惯,卻偏偏與公主長得像叮雳,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子妇汗,可洞房花燭夜當晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內容