ccle數(shù)據(jù)下載和整理

0.數(shù)據(jù)下載

網(wǎng)址:https://sites.broadinstitute.org/ccle

Datasets-Broad DepMap Portal-CCLE2019-Allfiles兼都,選擇tpm和annotation文件下載稽寒。

1.讀取表達(dá)矩陣

rm(list = ls())
dat = data.table::fread("CCLE_RNAseq_rsem_genes_tpm_20180929.txt.gz",data.table = F)
dat[1:4,1:4]
##              gene_id
## 1 ENSG00000000003.10
## 2  ENSG00000000005.5
## 3  ENSG00000000419.8
## 4  ENSG00000000457.9
##                                                                                                                  transcript_ids
## 1                                                                         ENST00000373020.4,ENST00000494424.1,ENST00000496771.1
## 2                                                                                           ENST00000373031.4,ENST00000485971.1
## 3 ENST00000371582.4,ENST00000371583.5,ENST00000371584.4,ENST00000371588.5,ENST00000413082.1,ENST00000466152.1,ENST00000494752.1
## 4                                     ENST00000367770.1,ENST00000367771.6,ENST00000367772.4,ENST00000423670.1,ENST00000470238.1
##   22RV1_PROSTATE 2313287_STOMACH
## 1           5.28            7.01
## 2           0.00            0.00
## 3          73.38          108.99
## 4           9.76           16.76

exp = as.matrix(dat[,-(1:2)])
library(stringr)
rownames(exp) = str_split(dat$gene_id,"\\.",simplify = T)[,1]
exp = log2(exp+1)
exp[1:4,1:4]

##                 22RV1_PROSTATE 2313287_STOMACH 253JBV_URINARY_TRACT
## ENSG00000000003       2.650765        3.001802             4.572890
## ENSG00000000005       0.000000        0.000000             0.000000
## ENSG00000000419       6.216843        6.781229             5.845741
## ENSG00000000457       3.427606        4.150560             1.839960
##                 253J_URINARY_TRACT
## ENSG00000000003           4.577731
## ENSG00000000005           0.000000
## ENSG00000000419           5.535742
## ENSG00000000457           2.087463

# 轉(zhuǎn)換行名
library(AnnoProbe)
library(tinyarray)
an = annoGene(rownames(exp),ID_type = "ENSEMBL")
exp = trans_array(exp,ids = an,from = "ENSEMBL",to = "SYMBOL")
exp[1:4,1:4]

##             22RV1_PROSTATE 2313287_STOMACH 253JBV_URINARY_TRACT
## DDX11L1          0.1634987       0.0000000           0.02856915
## WASH7P           4.5422580       4.1667154           3.79285535
## MIR1302-2HG      0.0000000       0.1505597           0.00000000
## FAM138A          0.0000000       0.0000000           0.95605665
##             253J_URINARY_TRACT
## DDX11L1              0.0000000
## WASH7P               3.5861642
## MIR1302-2HG          0.0000000
## FAM138A              0.5753123

2. 讀取注釋信息

clinical = read.delim("Cell_lines_annotations_20181226.txt")
colnames(clinical)[c(1,5)] = c("id","site")

3.表達(dá)矩陣和臨床信息對應(yīng)起來

a = intersect(colnames(exp),clinical$id)
exp = exp[,a]
clinical = clinical[match(a,clinical$id),]
identical(clinical$id,colnames(exp))

## [1] TRUE

4. 單基因表達(dá)量畫圖

library(dplyr)
#"METTL3","SETD2","TP53"
g = "METTL3"
pdat = cbind(gene = exp[g,],clinical[,c(1,5)])
library(tidyr)
pdat = drop_na(pdat,site)
su = group_by(pdat,site) %>% 
  summarise(a = median(gene)) %>% 
  arrange(desc(a))
pdat$site = factor(pdat$site,levels = su$site)
library(ggplot2)
library(RColorBrewer)
mypalette <- colorRampPalette(brewer.pal(8,"Set1"))
ggplot(pdat,aes(x = site,y = gene,fill = site))+
  geom_boxplot()+
  theme_bw()+
  theme(axis.text.x = element_text(vjust = 1,hjust = 1,angle = 70),legend.position = "bottom")+
  scale_fill_manual(values = mypalette(25))+
  guides (fill=guide_legend (nrow=3, byrow=TRUE))
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末赖淤,一起剝皮案震驚了整個濱河市谅河,隨后出現(xiàn)的幾起案子确丢,更是在濱河造成了極大的恐慌吐限,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件毯盈,死亡現(xiàn)場離奇詭異,居然都是意外死亡赘阀,警方通過查閱死者的電腦和手機(jī)脑奠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來轰豆,“玉大人齿诞,你說我怎么就攤上這事酸休〉昏荆” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵宿刮,是天一觀的道長貌夕。 經(jīng)常有香客問我踩叭,道長,這世上最難降的妖魔是什么自脯? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任嗤疯,我火速辦了婚禮闺兢,結(jié)果婚禮上戏罢,老公的妹妹穿的比我還像新娘。我一直安慰自己龟糕,他們只是感情好悔耘,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著缓艳,像睡著了一般看峻。 火紅的嫁衣襯著肌膚如雪阶淘。 梳的紋絲不亂的頭發(fā)上互妓,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天冯勉,我揣著相機(jī)與錄音澈蚌,去河邊找鬼灼狰。 笑死,一個胖子當(dāng)著我的面吹牛伏嗜,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播裸影,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼军熏,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了均践?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤彤委,失蹤者是張志新(化名)和其女友劉穎或衡,沒想到半個月后车遂,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體斯辰,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年衣陶,在試婚紗的時候發(fā)現(xiàn)自己被綠了闸氮。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡拯欧,死狀恐怖财骨,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情隆箩,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布杨蛋,位于F島的核電站,受9級特大地震影響逞力,放射性物質(zhì)發(fā)生泄漏糠爬。R本人自食惡果不足惜寇荧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一揩抡、第九天 我趴在偏房一處隱蔽的房頂上張望镀琉。 院中可真熱鬧峦嗤,春花似錦屋摔、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽曹体。三九已至硝烂,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間滞谢,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工母截, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留橄教,地道東北人清寇。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓华烟,卻偏偏與公主長得像持灰,于是被迫代替她去往敵國和親盔夜。 傳聞我的和親對象是個殘疾皇子堤魁,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評論 2 345