R可視化：使用R的circlize包繪制樣本-物種豐度關(guān)聯(lián)弦狀圖

R作圖-使用circlize繪制樣本物種豐度關(guān)聯(lián)弦狀圖

circlize圖也即是弦圖能較好展示樣本物種豐度關(guān)聯(lián)關(guān)系盟庞，先前從lyao222lll博客下載過(guò)該教程，但是最近劉老師關(guān)閉了博客，現(xiàn)有鏈接無(wú)法訪問(wèn)。根據(jù)劉老師的教程，只需要替換對(duì)應(yīng)的文本即可以畫(huà)出該圖猎醇。

文件準(zhǔn)備

首先準(zhǔn)備3個(gè)表格，分別為：

物種分類(lèi)信息文件（phylum_count.csv）努溃。第一列為物種ID（此處為OTU硫嘶，在circos圖的中間區(qū)域展示）梧税，第二列為OTU的“門(mén)水平”分類(lèi)信息（用于繪制circos外圈OTU分類(lèi)），第三列為OTU分類(lèi)詳細(xì)信息（用于在圖例中展示）第队。此外在后面的繪圖過(guò)程中，會(huì)使用該文件確定OTU的排列順序忆畅，所以請(qǐng)事先根據(jù)想要展示的順序給該文件中的OTU進(jìn)行排序。
樣本分組信息文件（phenotype.csv）家凯。第一列為樣本ID（此處為Case1如失、Control2等共計(jì)6個(gè)樣本，在circos圖的中間區(qū)域展示）褪贵，第二列為樣本分組信息（用于繪制circos外圈樣本分組抗俄，此處共計(jì)2個(gè)分組Case世舰、Control）动雹。此外在后面的繪圖過(guò)程中跟压，會(huì)使用該文件確定樣本的排列順序，所以請(qǐng)事先根據(jù)想要展示的順序給該文件中的樣本進(jìn)行排序裆馒。
物種豐度表格文件（family_count.csv）丐怯。每一列為樣本，每一行為物種（此處為OTU）梗搅，交叉區(qū)為個(gè)OTU在各樣本中的豐度（用于計(jì)算）。因OTU及樣本的繪圖順序由前述2個(gè)文件確定无切，所以在該文件中無(wú)需糾結(jié)樣本或OTU的排序丐枉。

load data

library(dplyr)
library(tibble)
library(circlize)

phen <- read.csv("phenotype.csv")
phylum <- read.csv("phylum_count.csv") %>%
  column_to_rownames("tax")
family <- read.csv("family_count.csv") %>%
  column_to_rownames("tax")

head(phen)

##   SampleID Group
## 1    Case1  Case
## 2    Case2  Case
## 3    Case3  Case
## 4    Case4  Case
## 5    Case5  Case
## 6    Case6  Case

head(phylum)

##                    Case1 Case2 Case3 Case4 Case5 Case6 Control1 Control2 Control3 Control4 Control5 Control6
## p_Actinobacteriota   557   361   250   323   365   809      176      195      175      357      311      275
## p_Bacteroidota      9672 21555 24904 32516 13872 11036    31353    33061    33657    33529    15822    30801
## p_Campilobacterota   111   438    48   177   325    89      888      363      161      341      139      176
## p_Cyanobacteria       34    30   201    15    34     6       22       13       48       32      104       36
## p_Deferribacterota     0     5     0     0     0     0        0        0        0        7        8        0
## p_Desulfobacterota   103   231    87   130    90    99      168      679      287      255      224      310

head(family)

##                                                                              Case1 Case2 Case3 Case4 Case5 Case6 Control1
## p_Actinobacteriota.c_Actinobacteria.o_Bifidobacteriales.f_Bifidobacteriaceae     6     0    30    30     0     0        2
## p_Actinobacteriota.c_Actinobacteria.o_Micrococcales.f_Micrococcaceae             0     3     0     0     4     7        0
## p_Actinobacteriota.c_Coriobacteriia.o_Coriobacteriales.f_Atopobiaceae          109    12    25    23    72    21       39
## p_Actinobacteriota.c_Coriobacteriia.o_Coriobacteriales.f_Coriobacteriaceae      92    27    10    35    41   161       55
## p_Actinobacteriota.c_Coriobacteriia.o_Coriobacteriales.f_Eggerthellaceae       254   306   185   139   196   605       61
## p_Actinobacteriota.c_Coriobacteriia.o_Coriobacteriales.f_uncultured             96    13     0    96    50     0       19
##                                                                              Control2 Control3 Control4 Control5 Control6
## p_Actinobacteriota.c_Actinobacteria.o_Bifidobacteriales.f_Bifidobacteriaceae        3        6        0       11        6
## p_Actinobacteriota.c_Actinobacteria.o_Micrococcales.f_Micrococcaceae                0        0        0        0        0
## p_Actinobacteriota.c_Coriobacteriia.o_Coriobacteriales.f_Atopobiaceae              27       14       35       50       22
## p_Actinobacteriota.c_Coriobacteriia.o_Coriobacteriales.f_Coriobacteriaceae         15       45      125       70       50
## p_Actinobacteriota.c_Coriobacteriia.o_Coriobacteriales.f_Eggerthellaceae          133       75      162      160      169
## p_Actinobacteriota.c_Coriobacteriia.o_Coriobacteriales.f_uncultured                17       35       35       20       28

get 5 most abundant phylum

num <- 5
merge_phy <- inner_join(phen %>% select(SampleID, Group),
                   phylum %>% t() %>% 
                        data.frame() %>%
                        rownames_to_column("SampleID"),
                  by = "SampleID") 
merge_phy_top <-  merge_phy %>%
      select(-c("SampleID", "Group")) %>%
      summarise_each(mean) %>%
      tidyr::gather(key="tax", value="value") %>%
      arrange(desc(value)) %>%
      slice(c(1:num)) %>%
      mutate(tax=as.character(tax))
head(merge_phy_top)

##                  tax      value
## 1       p_Firmicutes 39684.5000
## 2     p_Bacteroidota 24314.8333
## 3    p_Spirochaetota  4497.5833
## 4   p_Proteobacteria   950.1667
## 5 p_Actinobacteriota   346.1667

group information

group_info <- phen %>% select(SampleID, Group) 
head(group_info)

##   SampleID Group
## 1    Case1  Case
## 2    Case2  Case
## 3    Case3  Case
## 4    Case4  Case
## 5    Case5  Case
## 6    Case6  Case

function: get profile and circos

### get tax: taxname;phylum;detail and tax profile(rowname:tax, colnames:sampleid)
get_tax_prf <- function(prof=family, num=20, class=4){
  
 # prof=family
 # num=20
 # class=4
  
  prf <- prof %>% rownames_to_column("tax") %>%
    group_by(tax) %>%
    mutate(phylum=unlist(strsplit(tax, ".", fixed = TRUE))[1],
           otu=unlist(strsplit(tax, ".", fixed = TRUE))[class]) %>%
    ungroup()
  
  prf_cln <- prf %>% filter(phylum%in%merge_phy_top$tax) %>%
              slice(-grep("uncultured", otu)) #%>%
              # slice(-grep("_$", otu))
  
  mdat <- inner_join(phen %>% select(SampleID, Group),
                          prf_cln %>% select(-c("tax", "phylum")) %>%
                             column_to_rownames("otu") %>%
                             t() %>% data.frame() %>%
                             rownames_to_column("SampleID"),
                          by = "SampleID") 
  
  mdat_mean <-  mdat %>%
        select(-c("SampleID", "Group")) %>%
        summarise_each(mean) %>%
        tidyr::gather(key="tax", value="value") %>%
        arrange(desc(value)) %>%
        slice(c(1:num)) %>%
        mutate(tax=as.character(tax))
  
  prf_final <- prf_cln %>% filter(otu%in%mdat_mean$tax) %>%
    mutate()
  
  otu_table <- prf_final %>% select(-c("tax", "phylum")) %>%
    rename("OTU_ID"="otu") %>%
    mutate(OTU_ID=factor(OTU_ID, levels = mdat_mean$tax))
  
  tax_table <- prf_final %>% select(c("tax", "phylum", "otu")) %>%
    setNames(c("detail", "phylum", "OTU_ID")) %>%
    mutate(detail=gsub("\\.", ";", detail)) %>%
    mutate(phylum=factor(phylum, levels = merge_phy_top$tax))
  
  res <- list(otutab=otu_table,
              taxtab=tax_table)
  return(res)
}

### circos
circos_fun <- function(mdat_table=family_table, tag="family"){
  
  # mdat_table=family_table
  # tag="family"
  
  taxonomy <- mdat_table$taxtab
  otu_table <- mdat_table$otutab
  tax_phylum <- unique(taxonomy$phylum)
  all_group <- unique(group_info$Group)
  # merge table 
  otutab <- inner_join(taxonomy, otu_table, by="OTU_ID") %>%
    arrange(phylum, OTU_ID) %>%
    column_to_rownames("OTU_ID") %>%
    select(group_info$SampleID)
  
  # extra parameters 
  all_otu <- rownames(otutab)
  all_sample <- group_info$SampleID
  all_ID <- c(all_otu, all_sample)
  accum_otu <- rowSums(otutab)
  accum_sample <- colSums(otutab)
  all_ID_xlim <- cbind(rep(0, length(all_ID)), data.frame(c(accum_otu, accum_sample)))
  
  # inter parameters 
  otutab$otu_ID <- all_otu
  plot_data <- otutab %>% tidyr::gather(key="SampleID", value="value", -"otu_ID") %>%
    mutate(otu_ID=factor(otu_ID, levels = all_otu),
           SampleID=factor(SampleID, levels = all_sample)) %>%
    arrange(otu_ID, SampleID)

  plot_data <- plot_data[c(2, 1, 3, 3)]
  
  names(color_otu) <- all_otu
  names(color_sample) <- all_sample
  
  ### output PDF file
  name <- paste0(tag, "_circlize_plot.pdf")
  pdf(name, width = 20, height = 8)
  circle_size = unit(1, "snpc")
  
  gap_size <- c(rep(3, length(all_otu) - 1), 6, rep(3, length(all_sample) - 1), 6)
  circos.par(cell.padding = c(0, 0, 0, 0), start.degree = 270, gap.degree = gap_size)
  circos.initialize(factors = factor(all_ID, levels = all_ID), xlim = all_ID_xlim)
  
  circos.trackPlotRegion(
    ylim = c(0, 1), track.height = 0.03, bg.border = NA, 
    panel.fun = function(x, y) {
        sector.index = get.cell.meta.data("sector.index")
        xlim = get.cell.meta.data("xlim")
        ylim = get.cell.meta.data("ylim")
    } )
  
  for (i in 1:length(tax_phylum)) {
    tax_OTU <- {subset(taxonomy, phylum == tax_phylum[i])}$OTU_ID
    highlight.sector(tax_OTU, track.index = 1, col = color_phylum[i], 
                     text = tax_phylum[i], cex = 0.5, text.col = "black",
                     niceFacing = FALSE)
  }
  
  for (i in 1:length(all_group)) {
    group_sample <- {subset(group_info, Group == all_group[i])}$SampleID
    highlight.sector(group_sample, track.index = 1, col = color_group[i], 
                     text = all_group[i], cex = 0.7, text.col = 'black', 
                     niceFacing = FALSE)
  }
  

  circos.trackPlotRegion(
    ylim = c(0, 1), track.height = 0.05, bg.border = NA, 
    panel.fun = function(x, y) {
        sector.index = get.cell.meta.data('sector.index')
        xlim = get.cell.meta.data('xlim')
        ylim = get.cell.meta.data('ylim')
    } )
  
  circos.track(
    track.index = 2, bg.border = NA, 
    panel.fun = function(x, y) {
        xlim = get.cell.meta.data('xlim')
        ylim = get.cell.meta.data('ylim')
        sector.name = get.cell.meta.data('sector.index')
        xplot = get.cell.meta.data('xplot')
        
        by = ifelse(abs(xplot[2] - xplot[1]) > 30, 0.25, 1)
        for (p in c(0, seq(by, 1, by = by))) circos.text(p*(xlim[2] - xlim[1]) + xlim[1], mean(ylim) + 0.4, paste0(p*100, '%'), cex = 0.4, adj = c(0.5, 0), niceFacing = FALSE)
        
        circos.lines(xlim, c(mean(ylim), mean(ylim)), lty = 3)
    } )
  
  circos.trackPlotRegion(
    ylim = c(0, 1), track.height = 0.03, 
    bg.col = c(color_otu, color_sample), 
    bg.border = NA, track.margin = c(0, 0.01),
    panel.fun = function(x, y) {
        xlim = get.cell.meta.data('xlim')
        sector.name = get.cell.meta.data('sector.index')
        circos.axis(h = 'top', labels.cex = 0.4, 
                    major.tick.percentage = 0.4, labels.niceFacing = FALSE)
        circos.text(mean(xlim), 0.2, sector.name, cex = 0.4, 
                    niceFacing = FALSE, adj = c(0.5, 0))
    } )
  
  circos.trackPlotRegion(ylim = c(0, 1), track.height = 0.03, track.margin = c(0, 0.01))
  
  for (i in seq_len(nrow(plot_data))) {
    circos.link(
        plot_data[i,2], c(accum_otu[plot_data[i,2]], 
                          accum_otu[plot_data[i,2]] - plot_data[i,4]),
        plot_data[i,1], c(accum_sample[plot_data[i,1]], 
                          accum_sample[plot_data[i,1]] - plot_data[i,3]),
        col = paste0(color_otu[plot_data[i,2]], '70'), border = NA )
    
    circos.rect(accum_otu[plot_data[i,2]], 0, 
                accum_otu[plot_data[i,2]] - plot_data[i,4], 1, 
                sector.index = plot_data[i,2], 
                col = color_sample[plot_data[i,1]], border = NA)
    circos.rect(accum_sample[plot_data[i,1]], 0, 
                accum_sample[plot_data[i,1]] - plot_data[i,3], 1, 
                sector.index = plot_data[i,1], 
                col = color_otu[plot_data[i,2]], border = NA)
    
    accum_otu[plot_data[i,2]] = accum_otu[plot_data[i,2]] - plot_data[i,4]
    accum_sample[plot_data[i,1]] = accum_sample[plot_data[i,1]] - plot_data[i,3]
  }
  
  otu_legend <- Legend(
        at = all_otu, labels = taxonomy$detail, labels_gp = gpar(fontsize = 8),    
        grid_height = unit(0.5, 'cm'), grid_width = unit(0.5, 'cm'), 
        type = 'points', pch = NA, background = color_otu)
  
  pushViewport(viewport(x = 0.85, y = 0.5))
  grid.draw(otu_legend)
  upViewport()
        
  circos.clear()
  dev.off()
}

family levels circos

family_table <- get_tax_prf(prof = family, num = 15, class=4)
circos_fun(mdat_table = family_table, tag = "family")

該circos圖展示了21種OTU在12個(gè)樣本中的豐度關(guān)系弯院。其中辱士，21種OTU可劃分為3個(gè)門(mén)听绳，12個(gè)樣本可劃分為2個(gè)分組。

左側(cè)為circlize做圖結(jié)果椅挣，分為5圈。
第一圈鼠证，各OTU的門(mén)水平分類(lèi)以及各樣本的分組信息；
第二圈名惩，OTU相對(duì)豐度的百分比信息；
第三圈，OTU及樣本主區(qū)塊稚伍，以不同顏色和標(biāo)簽區(qū)分，區(qū)塊外周的刻度為OTU的絕對(duì)豐度信息个曙；
第四圈，OTU及樣本副區(qū)塊受楼，與主區(qū)塊（第三圈）對(duì)應(yīng)垦搬，展示了各OTU在各樣本中的豐度艳汽，以及各樣本所含每種OTU的豐度信息；
第五圈河狐，與OTU及樣本副區(qū)塊（第四圈）相對(duì)應(yīng)，連線展示OTU馋艺、樣本關(guān)聯(lián)信息。

version

sessionInfo()

## R version 4.0.2 (2020-06-22)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 19042)
## 
## Matrix products: default
## 
## locale:
## [1] LC_COLLATE=English_United States.1252  LC_CTYPE=English_United States.1252    LC_MONETARY=English_United States.1252
## [4] LC_NUMERIC=C                           LC_TIME=English_United States.1252    
## system code page: 936
## 
## attached base packages:
## [1] grid      stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
## [1] ComplexHeatmap_2.4.3 circlize_0.4.10      tibble_3.0.3         dplyr_1.0.0         
## 
## loaded via a namespace (and not attached):
##  [1] pillar_1.4.6        compiler_4.0.2      RColorBrewer_1.1-2  tools_4.0.2         digest_0.6.25       jsonlite_1.7.1     
##  [7] evaluate_0.14       lifecycle_0.2.0     clue_0.3-57         pkgconfig_2.0.3     png_0.1-7           rlang_0.4.7        
## [13] cli_2.1.0           rstudioapi_0.11     yaml_2.2.1          parallel_4.0.2      xfun_0.18           stringr_1.4.0      
## [19] knitr_1.30          cluster_2.1.0       generics_0.0.2      GlobalOptions_0.1.2 vctrs_0.3.2         tidyselect_1.1.0   
## [25] glue_1.4.1          R6_2.5.0            GetoptLong_1.0.4    fansi_0.4.1         rmarkdown_2.5       tidyr_1.1.2        
## [31] purrr_0.3.4         magrittr_1.5        ellipsis_0.3.1      htmltools_0.5.0     assertthat_0.2.1    shape_1.4.5        
## [37] colorspace_1.4-1    utf8_1.1.4          stringi_1.5.3       crayon_1.3.4        rjson_0.2.20

最后編輯于：2024.06.12 13:33:54

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

禁止轉(zhuǎn)載捐祠，如需轉(zhuǎn)載請(qǐng)通過(guò)簡(jiǎn)信或評(píng)論聯(lián)系作者碱鳞。

人面猴
序言：七十年代末踱蛀，一起剝皮案震驚了整個(gè)濱河市劫笙，隨后出現(xiàn)的幾起案子星岗，更是在濱河造成了極大的恐慌填大，老刑警劉巖，帶你破解...
沈念sama閱讀 206,126評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件允华，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡寥掐，警方通過(guò)查閱死者的電腦和手機(jī)靴寂，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)召耘，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)百炬，“玉大人，你說(shuō)我怎么就攤上這事污它∈” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0贊 341
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵歇攻，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我梆造，道長(zhǎng)缴守，這世上最難降的妖魔是什么镇辉？我笑而不...
開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任屡穗，我火速辦了婚禮忽肛，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘麻裁。我一直安慰自己源祈，他們只是感情好煎源，可當(dāng)我...
茶點(diǎn)故事閱讀 64,178評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布香缺。她就那樣靜靜地躺著手销，像睡著了一般图张。火紅的嫁衣襯著肌膚如雪锋拖。梳的紋絲不亂的頭發(fā)上祸轮，一...
開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1贊 284
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音适袜，去河邊找鬼。笑死苦酱，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的疫萤。我是一名探鬼主播，決...
沈念sama閱讀 38,276評(píng)論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼恒削，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼池颈！你這毒婦竟也來(lái)了蔓同？” 一聲冷哼從身側(cè)響起饶辙，我...
開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤弃揽，失蹤者是張志新（化名）和其女友劉穎则北，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體尚揣，經(jīng)...
沈念sama閱讀 43,400評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,883評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年娜庇，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了方篮。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 37,997評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡匕得，死狀恐怖巾表，靈堂內(nèi)的尸體忽然破棺而出汁掠，到底是詐尸還是另有隱情集币，我是刑警寧澤考阱，帶...
沈念sama閱讀 33,646評(píng)論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布鞠苟，位于F島的核電站乞榨，受9級(jí)特大地震影響偶妖，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜趾访，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,213評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一态秧、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧申鱼，春花似錦、人聲如沸捐友。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0贊 19
一樁弒父案猴鲫，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至牺弄，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間宜狐，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1贊 260
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工咱台，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留柑爸，地道東北人盒音。一個(gè)月前我還...
沈念sama閱讀 45,423評(píng)論 2贊 352
代替公主和親
正文我出身青樓表鳍，卻偏偏與公主長(zhǎng)得像祥诽，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子厘熟，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,722評(píng)論 2贊 345