最近年中總結(jié)分尸,我們來分享一些繪圖的操作,基礎(chǔ)知識歹嘹,多多學(xué)習(xí)
今天我們分享的是R包ggstatsplot寓落,非常完美的一個(gè)繪圖R包,我們來看看這個(gè)包的繪圖能力荞下。
1. R包的安裝和載入
install.packages("ggstatsplot")
install.packages("rstantools") # 使用到里面的函數(shù)
install.packages("afex") # 使用到里面的函數(shù)
library(ggstatsplot) # 只需載入一個(gè)包
R包get伶选! 接下來會一一介紹里面包含的幾個(gè)主要函數(shù)。
2. ggbetweenstats() : 多組間的均數(shù)比較
首先以多組間的均數(shù)比較為例尖昏,從而驗(yàn)證是否真的可以一行代碼作圖仰税。 接下來會用到R中自帶的iris數(shù)據(jù)集。
ggbetweenstats(data = iris, x = Species, y = Sepal.Length)
真是太牛了抽诉!只打了一行代碼陨簇,你卻給我這么多!太不公平了迹淌!像這樣的事情以后可以多來點(diǎn)!
不過!上面圖片里信息太多了,它們到底分別代表什么意思矢空?請看下圖:
總而言之歇竟,圖片上面的部分代表傳統(tǒng)的統(tǒng)計(jì)學(xué)方法(Frequentist)的一些統(tǒng)計(jì)值丧枪,下面的部分代表貝葉斯(Bayesian)的一些統(tǒng)計(jì)值。 文章末尾會介紹如何簡化圖片的輸出信息,比如去掉貝葉斯的內(nèi)容。現(xiàn)在繼續(xù)了解其他函數(shù)廷痘。
3. ggwithinstats():重復(fù)測量
一個(gè)組別如果分別在多個(gè)時(shí)間點(diǎn)被采集數(shù)據(jù),這種情況就歸屬于重復(fù)測量設(shè)計(jì)件已,就不能采用上述的多組間均數(shù)比較了笋额,因?yàn)橐呀?jīng)違反了獨(dú)立性的原則。在這種情況下篷扩,可以這么作圖:
ggwithinstats(data = iris, x = Species, y = Sepal.Length)
需要注意的是兄猩,為了演示,小編還是使用iris的數(shù)據(jù)集鉴未,而在重復(fù)測量的數(shù)據(jù)里枢冤,x軸通常指的是不同的時(shí)間。上圖中的紅色線條即為了注明它們之間是配對的歼狼。
4. ggscatterstats():散點(diǎn)圖
在研究兩個(gè)連續(xù)變量的時(shí)候掏导,散點(diǎn)圖可以呈現(xiàn)兩者間的關(guān)系享怀。下面也是一行搞定:
ggscatterstats(data = iris, x = Sepal.Length, y = Sepal.Width)
除了顯示散點(diǎn)圖羽峰,還分別畫出了兩個(gè)變量各自的直方圖從而可以觀察它們的分布情況,非常的實(shí)用添瓷!
5. gghistostats() :直方圖
如果有一個(gè)連續(xù)變量梅屉,想要觀察它的分布情況,以及通過單樣本t檢驗(yàn)去比較是否與一個(gè)特定的值有差異鳞贷,那么可以這么做:
gghistostats(data = iris, x = Sepal.Length, test.value = 6)
6. ggcorrmat() :多個(gè)變量的相關(guān)圖
要一下子呈現(xiàn)多個(gè)連續(xù)變量的關(guān)系坯汤,可以選擇相關(guān)矩陣。下方也是使用iris數(shù)據(jù)集搀愧,首先需將Species這個(gè)變量先剔除惰聂,然后作圖:
ggcorrmat(data = iris[, -5])
也是非常的實(shí)用,尤其在探索性分析階段咱筛。默認(rèn)使用Pesrson相關(guān)分析(參數(shù)性檢驗(yàn))搓幌,上述中含有X的方框,表示沒有統(tǒng)計(jì)學(xué)意義迅箩。
7. ggpiestats() :餅圖
如果有兩個(gè)分類變量溉愁,想要通過卡方檢驗(yàn)進(jìn)行率的比較,那可以采用餅圖的形式作圖饲趋。使用到mtcars數(shù)據(jù)集:
ggpiestats(data = mtcars, x = am, y = vs)
8. ggbarstats():呈現(xiàn)分類變量的柱狀圖
除了使用上面的餅圖拐揭,還可以使用柱狀圖:
ggbarstats(data = mtcars, x = am, y = vs)
9. ggcoefstats():將回歸系數(shù)作圖
比如撤蟆,建立了一個(gè)線性回歸模型,現(xiàn)在想要將自變量的回歸系數(shù)進(jìn)行作圖堂污,那可以這么做:
mymodel <- lm(mpg ~ cyl + disp + hp, data = mtcars)
ggcoefstats(mymodel) # 將回歸系數(shù)作圖
非常清新脫俗有沒有
10. 一行代碼搞定一切家肯?天下沒有這么容易的事情!
雖然說夢想是一行代碼搞定一切敷鸦,但現(xiàn)實(shí)中是不可能的息楔!
下面舉一個(gè)例子,如何進(jìn)一步調(diào)整輸出的圖片從而滿足自己的需求扒披。以第4部分的散點(diǎn)圖為例:
比如值依,研究中沒有用到貝葉斯,所以想要將圖片下方的一串統(tǒng)計(jì)值刪除碟案,并且覺得Sepal.Length這個(gè)變量并不符合正態(tài)分布愿险,所以選擇Spearman相關(guān)(默認(rèn)是Pearson相關(guān)),那么可以這么做:
ggscatterstats(data = iris, x = Sepal.Length, y = Sepal.Width,
bf.message = FALSE, # 去除貝葉斯相關(guān)的統(tǒng)計(jì)值
type = "nonparamatric") # 選擇非參數(shù)檢驗(yàn)
這里只是舉了一個(gè)小例子价说,這個(gè)包還可以對很多參數(shù)進(jìn)行修飾辆亏,由于篇幅有限,無法一一介紹鳖目,感興趣的小伙伴可以查看下方兩篇文獻(xiàn)深入了解扮叨。
好啦,今天的內(nèi)容就到這里领迈。如果有幫助彻磁,記得分享給需要的人!
生活很好狸捅,有你更好