添加p-value和顯著性標(biāo)記:ggsignif和ggpubr

在數(shù)據(jù)分析過(guò)程中劈猪,常常需要把組間的顯著性添加到圖形中丙唧,但是在ggplot2中實(shí)現(xiàn)起來(lái)略顯麻煩办桨,幸運(yùn)的是搭综,有很多R包可以幫助我們實(shí)現(xiàn)這一操作垢箕,比如ggsignif和ggpubr。

1. 統(tǒng)計(jì)方法

一般根據(jù)數(shù)據(jù)是否符合正態(tài)分布兑巾,選擇合適的統(tǒng)計(jì)方法:

統(tǒng)計(jì)方法 適用情況
t.test() 比較兩組(參數(shù))
wilcox.test() 比較兩組(非參數(shù))
aov()或anova() 比較多組(參數(shù))
kruskal.test() 比較多組(非參數(shù))

2. ggsignif

2.1 ggsignif介紹

ggsignif包主要函數(shù)為:geom_signif()stat_signif()条获,常用geom_signif()

# geom_signif參數(shù)
geom_signif(mapping = NULL, data = NULL, stat = "signif",
position = "identity", na.rm = FALSE, show.legend = NA,
inherit.aes = TRUE, comparisons = NULL, test = "wilcox.test",
test.args = NULL, annotations = NULL, map_signif_level = FALSE,
y_position = NULL, xmin = NULL, xmax = NULL, margin_top = 0.05,
step_increase = 0, tip_length = 0.03, size = 0.5, textsize = 3.88,
family = "", vjust = 0, ...)
常用參數(shù) 說(shuō)明示范
comparisons list蒋歌,設(shè)置需要比較的組帅掘,比如list(c("a","b"),c("a","c"))
test 上述統(tǒng)計(jì)方法,比如t.test()
test.args test傳入的參數(shù)
map_signif_level 布爾值堂油,p值直接被當(dāng)作注釋或者以星號(hào)替代修档,比如c(""=0.001,""=0.01,""=0.05)
annotations 帶有可選注釋的字符向量,如果沒(méi)有則被忽略
step_increase 不同組差異標(biāo)注的距離
2.2 ggsignif使用:

安裝

# 安裝穩(wěn)定版本:
install.packages("ggsignif")
#安裝最新開發(fā)版本:
devtools::install_github("const-ae/ggsignif")

使用iris數(shù)據(jù)集做演示

library(ggplot2)
library(ggthemr)     #載入主題配置包
library(ggsignif)    #載入ggsignif
library(patchwork) #載入拼圖包
head(iris)
#   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 1          5.1         3.5          1.4         0.2  setosa
# 2          4.9         3.0          1.4         0.2  setosa
# 3          4.7         3.2          1.3         0.2  setosa
# 4          4.6         3.1          1.5         0.2  setosa
# 5          5.0         3.6          1.4         0.2  setosa
# 6          5.4         3.9          1.7         0.4  setosa

Species的三組兩兩分別作差異性檢驗(yàn)府框,提前設(shè)定好配對(duì)分析的list

compaired <- list(c("versicolor", "virginica"), 
                  c("versicolor","setosa"), 
                  c("virginica","setosa"))

繪制geom_boxplot()和小提琴圖geom_violin()

ggthemr("flat")
p1 <- ggplot(iris, aes(Species, Sepal.Width, fill = Species)) +
    geom_boxplot() +
    ylim(1.5, 6.5) +
    geom_signif(comparisons = compaired,
                step_increase = 0.3,
                map_signif_level = F,
                test = wilcox.test)
p2 <- ggplot(iris, aes(Species, Sepal.Width, fill = Species)) +
    geom_violin() +
    ylim(1.5, 6.5) +
    geom_signif(comparisons = compaired,
                step_increase = 0.3,
                map_signif_level = T, #修改參數(shù)map_signif_level=TRUE
                test = wilcox.test)
p1|p2

3. ggpubr

3.1 介紹

ggpubr添加p-value主要使用ggpubr包中的兩個(gè)函數(shù):compare_means()stat_compare_mean()吱窝。

  • compare_means():可以進(jìn)行一組或多組間的比較。
compare_means(formula, data, method = "wilcox.test", paired = FALSE,
group.by = NULL, ref.group = NULL, ...)
參數(shù) 含義
formula 形如x~group迫靖,其中x是數(shù)值型變量院峡,group是因子,可以是一個(gè)或者多個(gè)
data 數(shù)據(jù)集
method 比較的方法系宜,默認(rèn)為"wilcox.test", 其他可選方法為:“t.test”照激、“anova”、“kruskal.test”
paired 是否要進(jìn)行paired test(TRUE or FALSE)
group_by 比較時(shí)是否要進(jìn)行分組
ref.group 是否需要指定參考組
  • stat_compare_mean():自動(dòng)添加p-value盹牧、顯著性標(biāo)記到ggplot圖中
stat_compare_means(mapping = NULL, comparisons = NULL hide.ns = FALSE,
label = NULL, label.x = NULL, label.y = NULL, ...)
參數(shù) 含義
mapping 由aes()創(chuàng)建的一套美學(xué)映射
comparisons 指定需要進(jìn)行比較以及添加p-value俩垃、顯著性標(biāo)記的組
hide.ns 是否要顯示顯著性標(biāo)記ns
label 顯著性標(biāo)記的類型,可選項(xiàng)為:p.signif(顯著性標(biāo)記)欢策、p.format(顯示p-value)
label.x吆寨、label.y 顯著性標(biāo)簽調(diào)整
其他參數(shù)
3.2 比較獨(dú)立的兩組
#先加載包
library(ggpubr)
library(patchwork)
data("ToothGrowth") #加載演示數(shù)據(jù)集ToothGrowth
head(ToothGrowth)
#    len supp dose
# 1  4.2   VC  0.5
# 2 11.5   VC  0.5
# 3  7.3   VC  0.5
# 4  5.8   VC  0.5
# 5  6.4   VC  0.5
# 6 10.0   VC  0.5
compare_means(len~supp, data=ToothGrowth)
## A tibble: 1 x 8
#  .y.   group1 group2      p p.adj p.format p.signif method 
#  <chr> <chr>  <chr>   <dbl> <dbl> <chr>    <chr>    <chr>  
#1 len   OJ     VC     0.0645 0.064 0.064    ns       Wilcox…

y:測(cè)試中使用的y變量
p:p-value
p.adj:調(diào)整后的p-value。默認(rèn)為p.adjust.method=“holm”
p.format:四舍五入后的p-value
p.signif:顯著性水平
method:用于統(tǒng)計(jì)檢驗(yàn)的方法

繪制箱線圖

p1 <- ggboxplot(ToothGrowth, x="supp", y="len", color = "supp",
               palette = "lancet", add = "jitter")#添加p-valuep+stat_compare_means()
#使用其他統(tǒng)計(jì)檢驗(yàn)方法
p2 <- p1+stat_compare_means(method = "t.test")
p1|p2

上述顯著性標(biāo)記可以通過(guò)label.x踩寇、label.y啄清、hjust及vjust來(lái)調(diào)整
顯著性標(biāo)記可以通過(guò)aes()映射來(lái)更改:
aes(label=…p.format…)或aes(lebel=paste0(“p=”,…p.format…)):只顯示p-value,不顯示統(tǒng)計(jì)檢驗(yàn)方法
aes(label=…p.signif…):僅顯示顯著性水平
aes(label=paste0(…method…,"\n", “p=”,…p.format…)):p-value與顯著性水平分行顯示
也可以將標(biāo)簽指定為字符向量俺孙,不要映射辣卒,只需將p.signif兩端的…去掉即可

3.3 配對(duì)樣本
compare_means(len~supp, data=ToothGrowth, paired = TRUE)
## A tibble: 1 x 8
#  .y.   group1 group2       p  p.adj p.format p.signif
#  <chr> <chr>  <chr>    <dbl>  <dbl> <chr>    <chr>   
#1 len   OJ     VC     0.00431 0.0043 0.0043   **      
## … with 1 more variable: method <chr>

利用ggpaired()進(jìn)行可視化

ggpaired(ToothGrowth, x="supp", y="len", color = "supp", line.color = "gray",
line.size = 0.4, palette = "jco")+ stat_compare_means(paired = TRUE)
3.4 多組比較 Global test
compare_means(len~dose, data=ToothGrowth, method = "anova")
## A tibble: 1 x 6
#  .y.          p   p.adj p.format p.signif method
#  <chr>    <dbl>   <dbl> <chr>    <chr>    <chr> 
#1 len   9.53e-16 9.5e-16 9.5e-16  ****     Anova 

繪圖

p1=ggboxplot(ToothGrowth, x="dose", y="len", color = "dose", palette = "jco")+
stat_compare_means()
#使用其他的方法
p2=ggboxplot(ToothGrowth, x="dose", y="len", color = "dose", palette = "jco")+
stat_compare_means(method = "anova")
p1|p2

Pairwise comparisons:如果分組變量中包含兩個(gè)以上的水平,那么會(huì)自動(dòng)進(jìn)行pairwise test,默認(rèn)方法為”wilcox.test”

compare_means(len~dose, data=ToothGrowth)
## A tibble: 3 x 8
#  .y.   group1 group2           p    p.adj p.format p.signif
#  <chr> <chr>  <chr>        <dbl>    <dbl> <chr>    <chr>   
#1 len   0.5    1          7.02e-6   1.4e-5 7.0e-06  ****    
#2 len   0.5    2          8.41e-8   2.5e-7 8.4e-08  ****    
#3 len   1      2          1.77e-4   1.8e-4 0.00018  ***     
## … with 1 more variable: method <chr>
#可以指定比較哪些組
my_comparisons <- list(c("0.5", "1"), c("1", "2"), c("0.5", "2"))
p1=ggboxplot(ToothGrowth, x="dose", y="len", color = "dose",palette = "jco")+
  stat_compare_means(comparisons=my_comparisons)+ # Add pairwisecomparisons p-value 
  stat_compare_means(label.y = 50) # Add global p-value
#可以通過(guò)修改參數(shù)label.y來(lái)更改標(biāo)簽的位置
p2=ggboxplot(ToothGrowth, x="dose", y="len", color = "dose",palette = "jco")+
  stat_compare_means(comparisons=my_comparisons, label.y = c(29, 35, 40))+
  # Add pairwise comparisons p-value
  stat_compare_means(label.y = 45) # Add global p-value
p1|p2

參考:https://blog.csdn.net/xj4math/article/details/115448669

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末睛榄,一起剝皮案震驚了整個(gè)濱河市荣茫,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌场靴,老刑警劉巖啡莉,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件港准,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡咧欣,警方通過(guò)查閱死者的電腦和手機(jī)浅缸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)魄咕,“玉大人衩椒,你說(shuō)我怎么就攤上這事∠迹” “怎么了毛萌?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)喝滞。 經(jīng)常有香客問(wèn)我阁将,道長(zhǎng),這世上最難降的妖魔是什么右遭? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任冀痕,我火速辦了婚禮,結(jié)果婚禮上狸演,老公的妹妹穿的比我還像新娘。我一直安慰自己僻他,他們只是感情好宵距,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著吨拗,像睡著了一般满哪。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上劝篷,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天哨鸭,我揣著相機(jī)與錄音,去河邊找鬼娇妓。 笑死像鸡,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的哈恰。 我是一名探鬼主播只估,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼干签,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼尼酿!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起感耙,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤荠医,失蹤者是張志新(化名)和其女友劉穎吁脱,沒(méi)想到半個(gè)月后桑涎,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡兼贡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年攻冷,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片紧显。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡讲衫,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出孵班,到底是詐尸還是另有隱情涉兽,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布篙程,位于F島的核電站枷畏,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏虱饿。R本人自食惡果不足惜拥诡,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望氮发。 院中可真熱鬧渴肉,春花似錦、人聲如沸爽冕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)颈畸。三九已至乌奇,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間眯娱,已是汗流浹背礁苗。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留徙缴,地道東北人试伙。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像娜搂,于是被迫代替她去往敵國(guó)和親迁霎。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容