作者:白介素2
美圖神器ggstatsplot-專為學(xué)術(shù)論文而生
在CRAN(comprehensive R Achive Netwokrk)中已有13000多個R包了
簡單講ggstatsplot能夠提供更為豐富信息的包,其實就是畫出高質(zhì)量的圖
不需要我們花費過多的精力去調(diào)整繪圖細(xì)節(jié),舉個例子
一般的探索性數(shù)據(jù)分過程析包括數(shù)據(jù)可視化與數(shù)據(jù)統(tǒng)計兩個部分窑邦,而ggstatsplot正是達(dá)到兩者結(jié)合的目的
舉例說明
組間比較-ggbetweenstats
library(ggstatsplot)
library(ggplot2)
p代表參數(shù)檢驗,np代表非參數(shù)
mpaa是分類變量识虚,y是數(shù)值型變量
head(movies_long)
## # A tibble: 6 x 8
## title year length budget rating votes mpaa genre
## <chr> <int> <int> <dbl> <dbl> <int> <fct> <fct>
## 1 Shawshank Redemption, The 1994 142 25 9.1 149494 R Drama
## 2 Lord of the Rings: The Ret~ 2003 251 94 9 103631 PG-13 Acti~
## 3 Lord of the Rings: The Fel~ 2001 208 93 8.8 157608 PG-13 Acti~
## 4 Lord of the Rings: The Two~ 2002 223 94 8.8 114797 PG-13 Acti~
## 5 Pulp Fiction 1994 168 8 8.8 132745 R Drama
## 6 Schindler's List 1993 195 25 8.8 97667 R Drama
ggbetweenstats(
data = movies_long,
x = mpaa, # > 2 groups
y = rating,
type = "p", # default
messages = FALSE
)
默認(rèn)參數(shù)繪圖
ggbetweenstats(
data = movies_long,
x = mpaa,
y = rating
)
配對比較
pairwise.display參數(shù)控制曾現(xiàn)的比較,ns無意義,all缀程,所有,s有意義的
ggbetweenstats(
data = movies_long,
x = mpaa,
y = rating,
type = "np",
mean.ci = TRUE,
pairwise.comparisons = TRUE,
pairwise.display = "s",
p.adjust.method = "fdr",
messages = FALSE
)
調(diào)整顏色,主題谊囚,可信區(qū)間調(diào)整右犹,突出值標(biāo)記
confi.level:可信區(qū)間調(diào)整,ggtheme主題急侥,pallete:顏色調(diào)用
outlier:超出界限標(biāo)記
ggwithinstats組內(nèi)比較
圖還是非常美觀,就不去細(xì)講每個參數(shù)了侮邀,需要時調(diào)用即可坏怪,這也是作者的意圖
相關(guān)性圖-ggscatterstats
代碼簡介,細(xì)節(jié)豐富
ggscatterstats(
data = movies_long,
x = budget,
y = rating,
type = "p", # default #<<<
conf.level = 0.99,
marginal=F,
messages = TRUE
)
其實還可以畫很多其它的圖绊茧,顏值都非常高铝宵,這里不再過多介紹,真正做到一圖勝千言
總結(jié)一下這個包的局限性:
- 雖然圖的信息量大华畏,但有時比如presentation鹏秋,時間不夠,圖信息過多反而不利于簡明扼要的傳達(dá)信息
- 另外就是計算的統(tǒng)計量比較單一
參考資料:官方文檔
本期內(nèi)容就到這里亡笑,我是白介素2侣夷,下期再見
廣而告之
說一個事,鑒于簡書平臺在信息傳播方面有不足之處仑乌,應(yīng)粉絲要求百拓,白介素2的個人微信平臺已經(jīng)開啟,繼續(xù)聊臨床與科研的故事晰甚,R語言衙传,數(shù)據(jù)挖掘,文獻(xiàn)閱讀等內(nèi)容厕九。當(dāng)然也不要期望過高蓖捶,微信平臺目前的定位是作為自己的讀書筆記,如果對大家有幫助最好扁远。如果感興趣腺阳, 可以掃碼關(guān)注下。
相關(guān)閱讀:
R語言生存分析-02-ggforest
R語言生存分析-01
生存曲線
R語言GEO數(shù)據(jù)挖掘01-數(shù)據(jù)下載及提取表達(dá)矩陣
R語言GEO數(shù)據(jù)挖掘02-解決GEO數(shù)據(jù)中的多個探針對應(yīng)一個基因
R語言GEO數(shù)據(jù)挖掘03-limma分析差異基因
R語言GEO數(shù)據(jù)挖掘04-功能富集分析
如果沒有時間精力學(xué)習(xí)代碼穿香,推薦了解:零代碼數(shù)據(jù)挖掘課程