篩選數(shù)據(jù)满粗,加入cart
從cart中下載需要的文件
image.png
紅框中為需要下載的文件威兜。
我選擇了使用linux client和gdc_manifest.txt下載的方式。client可以從這里下載https://gdc.cancer.gov/access-data/gdc-data-transfer-tool到服務器上苦酱。
文件處理
從metadata.cart.2022-09-22.json文件可以得知文件與id的對應關系酥泞,從而得到entity_submitter_id,之后取前三節(jié)(-分割)。
metadata.cart.json
與clinical.cases_selection.2022-09-22/clinical.tsv文件中的case_submitter_id對應乏梁,可以提取臨床信息次洼,常見的比如age, stage等。
clinical.tsv