大家新年快樂呀责球!好久好久沒有寫文了。過了一個懶散的新年雏逾,現(xiàn)在又要重新投入到科研之中啦。今天欣喜得知之前和師姐一起投的cover居然中了郑临,值得寫文紀念一下這個日子。今天來講一個其實我覺得用處不大的Treemap厢洞。
什么是Treemap圖
廢話不多說仇让,先上一張Treemap圖躺翻∩ミ矗可以看到一個大矩形按照一定比例被分割成了多個大小不同的小矩形获枝,每個小矩形代表著某一類別,不同顏色代表了不同類別省店。
沒錯嚣崭,這就是Treemap圖懦傍。Treemap圖,也可叫做矩形式樹狀結(jié)構(gòu)繪圖法粗俱,又稱為矩形式樹狀結(jié)構(gòu)圖繪制法说榆、樹狀結(jié)構(gòu)矩形圖繪制法,指的是一種利用嵌套式矩形來顯示樹狀結(jié)構(gòu)數(shù)據(jù)的方法签财。此種呈現(xiàn)方法能以不同顏色區(qū)塊呈現(xiàn)不同類別,可以透過區(qū)塊大小看出各類別數(shù)值大小比較唱蒸。當(dāng)該區(qū)塊范圍越大邦鲫,代表該類別數(shù)值越大神汹、越多。
雖然看似有趣屁魏,但是當(dāng)各類別的差異不明顯時滔以,Treemap圖難以體現(xiàn)出不同類別的差別,無法像bar圖等展現(xiàn)出不同類別的細微差異你画,不過這種嵌套結(jié)構(gòu)能夠更好地展現(xiàn)出多個層級的情況。比如在上圖中桃漾,綠色的都屬于California,因此呈队,可以發(fā)現(xiàn)California占比最大,進一步綠色中又是San Jose占比最大唱歧。
那么,下面讓我們舉一個具體的例子颅崩。之前几于,我們介紹過幾個搜索文獻的數(shù)據(jù)庫沿后,今天我們再次聚焦Web of Science。
Web of Science有一個功能是“Result Analysis”尖滚,可以對搜索的結(jié)果進行一些簡單的分析喉刘,比如這一主題近年來的發(fā)文趨勢漆弄、研究方向等睦裳。我在Web of Science中搜索了“gut microbiome”撼唾,并查看了分析結(jié)果中的“Institutions”,即腸道菌群領(lǐng)域中發(fā)文量前10的機構(gòu),得到了如下的Treemap圖:
可以看到University of California system(有那味了)是發(fā)文量最多的機構(gòu)蛛蒙,然后依次分別是哈佛大學(xué)、中科院牵祟。
當(dāng)然了深夯,其實也不一定要局限于矩形,Reactome數(shù)據(jù)庫上用了類似于水立方的形狀來繪制Treemap圖塌西,體現(xiàn)pathway富集結(jié)果。顏色越黃的模塊代表pvalue越顯著筝尾。
不過,總體來說筹淫,個人覺得這類可視化的方式可能在一些商業(yè)報告或者科學(xué)綜述中更具有施展空間站辉。在普通的研究論文中损姜,或許還是不夠直觀,這也是我覺得用處有限的原因摧阅。畢竟鄙人科研狗一只汰蓉。
如何作Treemap圖
今天,我們用兩種形式“復(fù)現(xiàn)”一下上圖中Web of Science的分析結(jié)果顾孽。
第一種,就是最傳統(tǒng)的Treemap圖比规,使用treemap包。
library(treemap)
library(RColorBrewer)
ExampleWOS<-data.frame(group=c("USA","USA","China","France","USA","Ireland","USA","France","UK","USA"),
subgroup=c("UNIVERSITY OF CALIFORNIA SYSTEM","HARVARD UNIVERSITY","CHINESE ACADEMY OF SCIENCES",
"INSTITUT NATIONAL DE LA SANTE ET DE LA RECHERCHE MEDICALE INSERM",
"UNIVERSITY OF NORTH CAROLINA","UNIVERSITY COLLEGE CORK",
"UNIVERSITY OF CALIFORNIA SAN DIEGO","INRAE","UNIVERSITY OF LONDON",
"UNIVERSITY OF TEXAS SYSTEM"),
value=c(4.770,3.083,1.821,1.758,1.578,1.495,1.495,1.466,1.389,1.374)
)
treemap(ExampleWOS,index=c("group","subgroup"),vSize="value",type="index",palette = "Set1")
第二種蜒什,我們將使用一個叫做voronoiTreemap的R包测秸,把矩形變成圓形灾常。這個包還可以有互動,不過沒有仔細研究岗憋,感覺是用于網(wǎng)站可視化的肃晚。
library(voronoiTreemap)
vt_d3(vt_export_json(vt_testdata()))
#數(shù)據(jù)來源Web of Science
ExampleWOS<-data.frame(h1=rep("Total",10),
h2=c("USA","USA","China","France","USA","Ireland","USA","France","UK","USA"),
h3=c("UNIVERSITY OF CALIFORNIA SYSTEM","HARVARD UNIVERSITY","CHINESE ACADEMY OF SCIENCES",
"INSTITUT NATIONAL DE LA SANTE ET DE LA RECHERCHE MEDICALE INSERM",
"UNIVERSITY OF NORTH CAROLINA","UNIVERSITY COLLEGE CORK",
"UNIVERSITY OF CALIFORNIA SAN DIEGO","INRAE","UNIVERSITY OF LONDON",
"UNIVERSITY OF TEXAS SYSTEM"),
color=c("#FFD700","#FFD700","#CD0000","#00BFFF","#FFD700","#225EA8","#FFD700","#00BFFF","#9ACD32","#FFD700"),
weight=c(4.770,3.083,1.821,1.758,1.578,1.495,1.495,1.466,1.389,1.374)#占所有文章的比例
)
ExampleWOS$codes<-ExampleWOS$h3
head(ExampleWOS)
h1 h2 h3 color weight
1 Total USA UNIVERSITY OF CALIFORNIA SYSTEM #FFD700 4.770
2 Total USA HARVARD UNIVERSITY #FFD700 3.083
3 Total China CHINESE ACADEMY OF SCIENCES #CD0000 1.821
4 Total France INSTITUT NATIONAL DE LA SANTE ET DE LA RECHERCHE MEDICALE INSERM #00BFFF 1.758
5 Total USA UNIVERSITY OF NORTH CAROLINA #FFD700 1.578
6 Total Ireland UNIVERSITY COLLEGE CORK #225EA8 1.495
codes
1 UNIVERSITY OF CALIFORNIA SYSTEM
2 HARVARD UNIVERSITY
3 CHINESE ACADEMY OF SCIENCES
4 INSTITUT NATIONAL DE LA SANTE ET DE LA RECHERCHE MEDICALE INSERM
5 UNIVERSITY OF NORTH CAROLINA
6 UNIVERSITY COLLEGE CORK
gdp_json <- vt_export_json(vt_input_from_df(ExampleWOS))
vt_d3(gdp_json)
今天的分享就到這里啦~
往期R數(shù)據(jù)可視化分享
R數(shù)據(jù)可視化22: 怎么獲取CNS級顏色搭配
R數(shù)據(jù)可視化21: Edge Bundling圖
R數(shù)據(jù)可視化20: 弦圖
R數(shù)據(jù)可視化19: 環(huán)狀條形圖
R數(shù)據(jù)可視化18: 弧形圖
R數(shù)據(jù)可視化17: 晒卮基圖
R數(shù)據(jù)可視化16: 啞鈴圖
R數(shù)據(jù)可視化15: 傾斜圖 Slope Graph
R數(shù)據(jù)可視化14: 生存曲線圖
R數(shù)據(jù)可視化13: 瀑布圖/突變圖譜
R數(shù)據(jù)可視化12: 曼哈頓圖
R數(shù)據(jù)可視化11: 相關(guān)性圖
R數(shù)據(jù)可視化10: 蜜蜂圖 Beeswarm
R數(shù)據(jù)可視化9: 棒棒糖圖 Lollipop Chart
R數(shù)據(jù)可視化8: 金字塔圖和偏差圖
R數(shù)據(jù)可視化7: 氣泡圖 Bubble Plot
R數(shù)據(jù)可視化6: 面積圖 Area Chart
R數(shù)據(jù)可視化5: 熱圖 Heatmap
R數(shù)據(jù)可視化4: PCA和PCoA圖
R數(shù)據(jù)可視化3: 直方/條形圖
R數(shù)據(jù)可視化2: 箱形圖 Boxplot
R數(shù)據(jù)可視化1: 火山圖