【生信技能樹(shù)】R語(yǔ)言練習(xí)題-初級(jí)-可視化(8-12題)

題目來(lái)源:http://www.bio-info-trainee.com/3793.html

基于下午的統(tǒng)計(jì)可視化

  1. 對(duì)前面讀取的 RunInfo Table 文件在R里面探索其MBases列头谜,包括 箱線圖(boxplot)和五分位數(shù)(fivenum)蟆盹,還有頻數(shù)圖(hist),以及密度圖(density) 滥壕。

【相關(guān)知識(shí)鏈接】
箱線圖 - boxplot
五分位數(shù) - fivenum
頻數(shù)圖 - histogram
密度圖 - density

> rm(list = ls())
> options(stringsAsFactors = F)
> sra <- read.table(file = "SraRunTable.txt",header = T,sep = '\t')
#箱線圖
> boxplot(sra$MBases)
箱線圖
#五分位數(shù)
> fivenum(sra$MBases)
[1]  0  8 12 16 74
#頻數(shù)圖
> hist(sra$MBases)
頻數(shù)圖
#密度圖
> density(sra$MBases)

Call:
    density.default(x = sra$MBases)

Data: sra$MBases (768 obs.);    Bandwidth 'bw' = 1.423

       x                y            
 Min.   :-4.269   Min.   :0.0000000  
 1st Qu.:16.366   1st Qu.:0.0000353  
 Median :37.000   Median :0.0003001  
 Mean   :37.000   Mean   :0.0121039  
 3rd Qu.:57.634   3rd Qu.:0.0142453  
 Max.   :78.269   Max.   :0.0665647 
> plot(density(sra$MBases))
密度圖
#某個(gè)包里畫(huà)密度圖的函數(shù)
> library(lattice)
> densityplot(sra$MBases)
密度圖2
  1. 把前面讀取的樣本信息表格的樣本名字根據(jù)下劃線分割看第3列元素的統(tǒng)計(jì)情況变秦。第三列代表該樣本所在的plate 。
> plate <- unlist(strsplit(df_merge$Title,'_'))
> length(plate)
[1] 3072
> tmp <- seq(from = 3,to = length(plate),by = 4)
> plate <- plate[tmp]
> length(plate)
[1] 768
> table(plate)
plate
0048 0049 
 384  384 

根據(jù)plate把關(guān)聯(lián)到的 RunInfo Table 信息的MBases列分組檢驗(yàn)是否有統(tǒng)計(jì)學(xué)顯著的差異。

> df_merge$plate <- plate
> t.test(df_merge$MBases~plate)

    Welch Two Sample t-test

data:  df_merge$MBases by plate
t = 2.3194, df = 728.18, p-value = 0.02065
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1739531 2.0916719
sample estimates:
mean in group 0048 mean in group 0049 
          13.78125           12.64844 

p<0.05迎膜,有顯著性差異

分組繪制箱線圖(boxplot),頻數(shù)圖(hist)浆兰,以及密度圖(density) 磕仅。

#箱線圖
>boxplot(df_merge$MBases~df_merge$plate)
箱線圖
#頻數(shù)圖
#按plate拆分df_merge
df_merge_0048 <- df_merge[df_merge$plate=='0048',]
df_merge_0049 <- df_merge[df_merge$plate=='0049',]
hist(df_merge_0048$MBases)
hist(df_merge_0049$MBases)
plate==0048箱線圖
plate==0049箱線圖
#密度圖
plot(density(df_merge_0048$MBases))
plot(density(df_merge_0049$MBases))
plate==0048密度圖
plate==0049密度圖
  1. 使用ggplot2把上面的圖進(jìn)行重新繪制。
> library(ggplot2)
#箱線圖
ggplot()+
  geom_boxplot(
    data =df_merge,
    mapping = aes(x=plate,y=MBases,fill = plate)
  )
#頻數(shù)圖
ggplot()+
  stat_count(
    data = df_merge,
    mapping = aes(x = MBases)
  )+
  facet_wrap(~plate,scales = "free") #分片
ggplot()+
  stat_count(
    data = df_merge,
    mapping = aes(x = MBases,fill = plate) #填充
  )
#密度圖
ggplot()+
  geom_density(
    data = df_merge,
    mapping = aes(x = MBases, fill = plate)
  )
ggplot2箱線圖

ggplot2頻數(shù)圖_分片

ggplot2頻數(shù)圖_填充

ggplot2密度圖_分片

ggplot2密度圖_填充
  1. 使用ggpubr把上面的圖進(jìn)行重新繪制簸呈。
BiocManager::install("ggpubr")
library(ggpubr)
ggboxplot(data = df_merge,x = "plate", y = "MBases",fill = "plate")
gghistogram(data = df_merge,x = "MBases",fill = "plate")
ggdensity(data = df_merge,x = "MBases",fill = "plate")
ggpubr箱線圖

ggpubr頻數(shù)圖

ggpubr密度圖
  1. 隨機(jī)取384個(gè)MBases信息榕订,跟前面的兩個(gè)plate的信息組合成新的數(shù)據(jù)框,第一列是分組蜕便,第二列是MBases劫恒,總共是384*3行數(shù)據(jù)。
> options(stringsAsFactors = F)
> set.seed(10000)
> id <- sample.int(nrow(df_merge),384,replace = F)
> id
  [1] 286 335 301 460  84 265 205  67 575 198 267 272 461  18 422 319 229 226 645 757 558 592 355 520 328 281 442 627 668 641 609 114 152 413 408   3
 [37]  39 648 580 135 541  47 295 603  42  14 417 218 707 634 271 638  26 615 162 459 725 154 754 521 390 268 282 386 367 727 637 148 685 765  92 305
 [73] 746 658 550 597 312 721 566 686 544 768  58 435 225 248  13 376 684 676 311  85 696  64 481 457 657 759 527  20 533 710 453  10 437 733 595 683
[109] 112 115 735  57 372 583 181 213 697 145  29 705 736 325 208 202 317 687 655 767 652 320 299 425 283 728 485 323 434 734 382  66 186 441 448 196
[145] 432 747 258 339 238 484 375 760 388 297  73 623  83 254 356 654 189 546  32 377 369  37  78 223 157 212 131 147 598 624 451 724 557 633 470 409
[181] 141 547 232  61 694 333 755 287 766 714 589 117 532  76 426 713 499 344  75 748 398 366 555 184 519 664 715 237 309 331 545  48 449 180 296 276
[217] 752 251  74  27  30 581 574  79 610  90  62 682 279 264 310 108 407  54 273   1 554 567 308  36 471  69 672 109  23 496 444 285  81 515 761 304
[253] 509 462 330 630 656 487  34 602 395 132 137 675 418 490 347 242 618 559 616 191 649 552 158 582 190 220 651  53 138 235 172 354 433 342  97 511
[289] 163 401  49 474 763 504 151 531 161 586 421 500 394 628 493 506  65  28 642 660 643 756 368  63 253 525 321 103  24 606 551  40 438 211 577  86
[325] 465 587  19 741 607  72  15 601 133 662 340 343 456 256  56 663 647 362 129 726 447 252 274 599 494 522 187 378 351 718 120 402 743 360 701 611
[361] 244 290 738  45 593 689 518 640 313 125 745 454 165 571 646  17 140 405 680 636 124  25 436 560
> T12 <- data.frame(group = df_merge$plate[id],MBases = df_merge$MBases[id],id = df_merge$Run)
> str(T12)
'data.frame':   768 obs. of  3 variables:
 $ group : chr  "0048" "0048" "0048" "0049" ...
 $ MBases: int  11 15 23 11 17 13 20 21 23 13 ...
 $ id    : chr  "SRR6790720" "SRR6790711" "SRR6790712" "SRR6790713" ...
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末轿腺,一起剝皮案震驚了整個(gè)濱河市两嘴,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌族壳,老刑警劉巖憔辫,帶你破解...
    沈念sama閱讀 222,865評(píng)論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異仿荆,居然都是意外死亡贰您,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,296評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門拢操,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)锦亦,“玉大人,你說(shuō)我怎么就攤上這事令境「茉埃” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 169,631評(píng)論 0 364
  • 文/不壞的土叔 我叫張陵舔庶,是天一觀的道長(zhǎng)返劲。 經(jīng)常有香客問(wèn)我,道長(zhǎng)栖茉,這世上最難降的妖魔是什么篮绿? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,199評(píng)論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮吕漂,結(jié)果婚禮上亲配,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好吼虎,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,196評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布犬钢。 她就那樣靜靜地躺著,像睡著了一般思灰。 火紅的嫁衣襯著肌膚如雪玷犹。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,793評(píng)論 1 314
  • 那天洒疚,我揣著相機(jī)與錄音歹颓,去河邊找鬼。 笑死油湖,一個(gè)胖子當(dāng)著我的面吹牛巍扛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播乏德,決...
    沈念sama閱讀 41,221評(píng)論 3 423
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼撤奸,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了喊括?” 一聲冷哼從身側(cè)響起胧瓜,我...
    開(kāi)封第一講書(shū)人閱讀 40,174評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎郑什,沒(méi)想到半個(gè)月后府喳,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,699評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蹦误,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,770評(píng)論 3 343
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了肉津。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片强胰。...
    茶點(diǎn)故事閱讀 40,918評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖妹沙,靈堂內(nèi)的尸體忽然破棺而出偶洋,到底是詐尸還是另有隱情,我是刑警寧澤距糖,帶...
    沈念sama閱讀 36,573評(píng)論 5 351
  • 正文 年R本政府宣布玄窝,位于F島的核電站,受9級(jí)特大地震影響悍引,放射性物質(zhì)發(fā)生泄漏恩脂。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,255評(píng)論 3 336
  • 文/蒙蒙 一趣斤、第九天 我趴在偏房一處隱蔽的房頂上張望俩块。 院中可真熱鬧,春花似錦、人聲如沸玉凯。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,749評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)漫仆。三九已至捎拯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間盲厌,已是汗流浹背署照。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,862評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留狸眼,地道東北人藤树。 一個(gè)月前我還...
    沈念sama閱讀 49,364評(píng)論 3 379
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像拓萌,于是被迫代替她去往敵國(guó)和親岁钓。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,926評(píng)論 2 361