TCGA下載RNA-seq數(shù)據(jù)的區(qū)別

現(xiàn)UCSC xena已經(jīng)將TCGA數(shù)據(jù)匯總整理得很好了轮蜕,連表達(dá)矩陣都已轉(zhuǎn)換完成朽合。
但如果有心就會發(fā)現(xiàn)做入,UCSC上的RNAseq數(shù)據(jù)有3個下載鏈接缭嫡,以下將以
cohort: TCGA Breast Cancer (BRCA)為例做一整理說明:
https://xenabrowser.net/datapages/?cohort=TCGA%20Breast%20Cancer%20(BRCA)&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443
gene expression RNAseq下:
1:<abbr style="border-width: 0px 0px 1px; border-top-style: initial; border-right-style: initial; border-bottom-style: dotted; border-left-style: initial; border-top-color: initial; border-right-color: initial; border-bottom-color: rgb(102, 102, 102); border-left-color: initial; border-image: initial; font-family: inherit; font-size: 15px; font-style: inherit; font-weight: inherit; margin: 0px; outline: 0px; padding: 0px; vertical-align: baseline; cursor: help;">IlluminaHiSeq</abbr>* (n=1,218) TCGA hub:由Illumina HiSeq 2000 RNA 測序平臺完成,該數(shù)據(jù)集都已經(jīng)過 log2(x+1)轉(zhuǎn)換惜颇,其中x是RSEM值皆刺。raw_count是某個轉(zhuǎn)錄本/基因的測到的原始reads條數(shù),normalized_count是經(jīng)過標(biāo)準(zhǔn)化的數(shù)據(jù)量。做差異分析就是用normalized_count的值來做的官还。先根據(jù)count芹橡,利用rsem軟件來計算表達(dá)量,然后根據(jù)表達(dá)量進(jìn)行表達(dá)差異分析望伦。

  1. Gene expression RNAseq (IlluminaHiSeq pancan normalize
    <abbr style="border-width: 0px 0px 1px; border-top-style: initial; border-right-style: initial; border-bottom-style: dotted; border-left-style: initial; border-top-color: initial; border-right-color: initial; border-bottom-color: rgb(102, 102, 102); border-left-color: initial; border-image: initial; font-family: inherit; font-size: 15px; font-style: inherit; font-weight: inherit; margin: 0px; outline: 0px; padding: 0px; vertical-align: baseline; cursor: help;">IlluminaHiSeq pancan normalized</abbr> (n=1,218) TCGA hubd):如果分析時同時使用了其它類型腫瘤的數(shù)據(jù)林说,建議使用該數(shù)據(jù)煎殷,即在不同腫瘤間對數(shù)據(jù)做了處理。因為TCGA提供30-40種RNAseq,這樣TCGA可以作為各種腫瘤研究的大背景腿箩。

  2. Gene expression RNAseq (IlluminaHiSeq percentile)
    <abbr style="border-width: 0px 0px 1px; border-top-style: initial; border-right-style: initial; border-bottom-style: dotted; border-left-style: initial; border-top-color: initial; border-right-color: initial; border-bottom-color: rgb(102, 102, 102); border-left-color: initial; border-image: initial; font-family: inherit; font-size: 15px; font-style: inherit; font-weight: inherit; margin: 0px; outline: 0px; padding: 0px; vertical-align: baseline; cursor: help;">IlluminaHiSeq percentile</abbr> (n=1,218) TCGA hub:如果需要與TCGA以外的數(shù)據(jù)進(jìn)行比較豪直,且外部數(shù)據(jù)也percentile rank進(jìn)行處理,可選擇該數(shù)據(jù)珠移。
    這些值percentile ranks ranges為 0 – 100之間, 值越小表示表達(dá)越低. 大家可以結(jié)合 TCGA RNAseq 數(shù)據(jù) 與自己的RNAseq data, perform normalization across the combined dataset using whatever method you choose, then analyze the combined dataset further.可自行選擇合適的方法進(jìn)行標(biāo)準(zhǔn)化弓乙,然后進(jìn)行進(jìn)一步的分析。

  3. TCGA Pan-Cancer gene expression
    For comparison across multiple or all TCGA cohorts. Dataset is generated at UCSC by combining “gene expression RNAseq (IlluminaHiSeq) data” (see above) from all TCGA cohorts. No further normalization is performed钧惧。(具體使用待查)暇韧。

** TCGA下載文件中都代表哪些值?**

| Example filename | Values in file |
| TCGA_KIRC_exp_HiSeqV2 | Log2(x+1), x is the RSEM value |
| TCGA_KIRC_exp_HiSeqV2_PANCAN | Log2(x+1) value mean-normalized per-gene across all TCGA samples, extracted converted values only belong to this cohort. x is the RSEM value |
| TCGA_KIRC_exp_HiSeqV2_percentile | Percentile ranking of RSEM value per sample, values range from 0 to 100, lower values representing lower expression |
| TCGA_KIRC_gistic2 | Gistic2 value from Broad Firehose |
| TCGA_KIRC_gistic2thd | Gistic2 value discretized to -2,-1,0,1,2 by Broad Firehose |
| TCGA_KIRC_hMethyl27 | beta values |
| TCGA_KIRC_hMethyl450 | beta values |
| TCGA_KIRC_miRNA | Log2(x+1), x is RPKM value |
| TCGA_KIRC_mutation | PANCAN AWG somatic mutation calls |
| TCGA_KIRC_PDMRNAseq | Pathway inference score derived using RNAseq data alone (generated at Firehose) |
| TCGA_KIRC_PDMRNAseqCNV | Pathway inference score derived using RNAseq and copy number data (generated at Firehose) |
| TCGA_KIRC_RPPA | RPPA value |
| TCGA_KIRC_RPPA_RBN | RBN-normalized RPP |

廣而告之

說一個事浓瞪,鑒于簡書平臺在信息傳播方面有不足之處懈玻,應(yīng)粉絲要求,白介素2的個人微信平臺已經(jīng)開啟乾颁,繼續(xù)聊臨床與科研的故事涂乌,R語言,數(shù)據(jù)挖掘英岭,文獻(xiàn)閱讀等內(nèi)容湾盒。當(dāng)然也不要期望過高,微信平臺目前的定位是作為自己的讀書筆記诅妹,如果對大家有幫助最好罚勾。如果感興趣, 可以掃碼關(guān)注下漾唉。


qrcode_for_gh_9eaa04438675_258.jpg
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末荧库,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子赵刑,更是在濱河造成了極大的恐慌,老刑警劉巖场刑,帶你破解...
    沈念sama閱讀 222,378評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件般此,死亡現(xiàn)場離奇詭異,居然都是意外死亡牵现,警方通過查閱死者的電腦和手機铐懊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,970評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瞎疼,“玉大人科乎,你說我怎么就攤上這事≡艏保” “怎么了茅茂?”我有些...
    開封第一講書人閱讀 168,983評論 0 362
  • 文/不壞的土叔 我叫張陵捏萍,是天一觀的道長。 經(jīng)常有香客問我空闲,道長令杈,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,938評論 1 299
  • 正文 為了忘掉前任碴倾,我火速辦了婚禮逗噩,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘跌榔。我一直安慰自己异雁,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 68,955評論 6 398
  • 文/花漫 我一把揭開白布僧须。 她就那樣靜靜地躺著纲刀,像睡著了一般。 火紅的嫁衣襯著肌膚如雪皆辽。 梳的紋絲不亂的頭發(fā)上柑蛇,一...
    開封第一講書人閱讀 52,549評論 1 312
  • 那天,我揣著相機與錄音驱闷,去河邊找鬼耻台。 笑死,一個胖子當(dāng)著我的面吹牛空另,可吹牛的內(nèi)容都是我干的盆耽。 我是一名探鬼主播,決...
    沈念sama閱讀 41,063評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼扼菠,長吁一口氣:“原來是場噩夢啊……” “哼摄杂!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起循榆,我...
    開封第一講書人閱讀 39,991評論 0 277
  • 序言:老撾萬榮一對情侶失蹤析恢,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后秧饮,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體映挂,經(jīng)...
    沈念sama閱讀 46,522評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,604評論 3 342
  • 正文 我和宋清朗相戀三年盗尸,在試婚紗的時候發(fā)現(xiàn)自己被綠了柑船。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,742評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡泼各,死狀恐怖鞍时,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤逆巍,帶...
    沈念sama閱讀 36,413評論 5 351
  • 正文 年R本政府宣布及塘,位于F島的核電站,受9級特大地震影響蒸苇,放射性物質(zhì)發(fā)生泄漏磷蛹。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,094評論 3 335
  • 文/蒙蒙 一溪烤、第九天 我趴在偏房一處隱蔽的房頂上張望味咳。 院中可真熱鬧,春花似錦檬嘀、人聲如沸槽驶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,572評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽掂铐。三九已至,卻和暖如春揍异,著一層夾襖步出監(jiān)牢的瞬間全陨,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,671評論 1 274
  • 我被黑心中介騙來泰國打工衷掷, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留辱姨,地道東北人。 一個月前我還...
    沈念sama閱讀 49,159評論 3 378
  • 正文 我出身青樓戚嗅,卻偏偏與公主長得像雨涛,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子懦胞,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,747評論 2 361

推薦閱讀更多精彩內(nèi)容