前面給大家介紹了新版的TCGA數(shù)據(jù)庫尽楔,通過文字和視頻給大家講解了如何從TCGA數(shù)據(jù)庫下載RNAseq數(shù)據(jù)和miRNAseq數(shù)據(jù)
? 新版TCGA數(shù)據(jù)庫RNAseq數(shù)據(jù)下載
? 新版TCGA數(shù)據(jù)庫miRNA數(shù)據(jù)下載
以及如何合并成矩陣
? 【視頻講解】R代碼合并新版TCGA中RNAseq表達(dá)譜矩陣
? 【視頻講解】R代碼合并新版TCGA中miRNA表達(dá)譜矩陣
? 零代碼合并新版TCGA中RNAseq和miRNA表達(dá)譜
我們經(jīng)常會(huì)在SCI文章里面看到下面這樣的圖來,展示體細(xì)胞突變(somatic mutation)的數(shù)據(jù)皆疹。
這個(gè)圖叫瀑布圖,展示每一樣本中的各種類型的突變砚嘴,包括錯(cuò)義突變掷贾,移碼突變,無義突變梅垄,插入缺失等等。要想畫出這張圖输玷,首先我們必須要準(zhǔn)本好數(shù)據(jù)队丝。今天小編就來跟大家聊聊怎么從TCGA數(shù)據(jù)庫下載體細(xì)胞突變(somatic mutation)數(shù)據(jù)。
1.打開TCGA網(wǎng)站欲鹏,輸入需要下載的腫瘤類型
2.點(diǎn)擊WXS后面的數(shù)字51
3.點(diǎn)擊左上角File
4.選擇WXS机久,Masked Somatic Mutation,maf赔嚎,simple nucleotide variation膘盖,Aliquot Ensemble Somatic Variant Merging and masking,然后Add all files to cart
5.這51個(gè)文件就加入右上角的購物車?yán)锩媪?/p>
6.下載sample sheet和Download下拉框里里面的Cart
得到兩個(gè)文件
gdc_download_20220418_080408.481174.tar.gz和gdc_sample_sheet.2022-04-18.tsv
7.新建一個(gè)文件夾尤误,名叫TCGA_CHOL_maf
在TCGA_CHOL_maf下面再建一個(gè)文件夾叫maf
將gdc_sample_sheet.2022-04-18.tsv拷貝到TCGA_CHOL_maf中侠畔,重命名為maf_sample_sheet.tsv。
將gdc_download_20220418_080408.481174.tar.gz拷貝到maf中解壓
TCGA_CHOL_maf文件夾結(jié)果如下
TCGA_CHOL_maf/maf文件夾結(jié)構(gòu)如下
那么到這里损晤,我們就下載好了膽管癌的體細(xì)胞突變的數(shù)據(jù)了软棺。下一期內(nèi)容,我們將使用R代碼將這些數(shù)據(jù)合并成一個(gè)矩陣尤勋,為繪制瀑布圖做準(zhǔn)備喘落。