箱線圖是數(shù)據(jù)集中的數(shù)據(jù)分布良好的度量渣叛。 它將數(shù)據(jù)集分成三個(gè)四分位數(shù)哟玷。 此圖表表示數(shù)據(jù)集中的最小值,最大值仅乓,中值赖舟,第一四分位數(shù)和第三四分位數(shù)。 它還可用于通過(guò)繪制每個(gè)數(shù)據(jù)集的箱線圖來(lái)比較數(shù)據(jù)集之間的數(shù)據(jù)分布方灾。R語(yǔ)言中使用boxplot()函數(shù)來(lái)創(chuàng)建箱線圖建蹄。
語(yǔ)法
在R語(yǔ)言中創(chuàng)建箱線圖的基本語(yǔ)法是 -
boxplot(x, data, notch, varwidth, names, main)
以下是所使用的參數(shù)的描述 -
x是向量或公式。
****數(shù)據(jù)是數(shù)據(jù)幀裕偿。
notch是邏輯值洞慎。 設(shè)置為TRUE以繪制凹口。
varwidth是一個(gè)邏輯值嘿棘。 設(shè)置為true以繪制與樣本大小成比例的框的寬度劲腿。
******names**是將打印在每個(gè)箱線圖下的組標(biāo)簽。
main用于給圖表標(biāo)題鸟妙。
例
我們使用R語(yǔ)言環(huán)境中可用的數(shù)據(jù)集“mtcars”來(lái)創(chuàng)建基本箱線圖焦人。 讓我們看看mtcars中的列“mpg”和“cyl”挥吵。
input <- mtcars[,c('mpg','cyl')]print(head(input))
當(dāng)我們執(zhí)行上面的代碼,它會(huì)產(chǎn)生以下結(jié)果 -
mpg cylMazda RX4 21.0 6Mazda RX4 Wag 21.0 6Datsun 710 22.8 4Hornet 4 Drive 21.4 6Hornet Sportabout 18.7 8Valiant 18.1 6
創(chuàng)建箱線圖
以下腳本將為mpg(英里/加侖)和cyl(氣缸數(shù))之間的關(guān)系創(chuàng)建箱線圖花椭。
Give the chart file a name.png(file = "boxplot.png")# Plot the chart.boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders", ylab = "Miles Per Gallon", main = "Mileage Data")# Save the file.dev.off()
當(dāng)我們執(zhí)行上面的代碼忽匈,它產(chǎn)生以下結(jié)果 -
帶槽的箱線圖
我們可以繪制帶槽的箱線圖矿辽,以了解不同數(shù)據(jù)組的中值如何相互匹配丹允。以下腳本將為每個(gè)數(shù)據(jù)組創(chuàng)建一個(gè)帶缺口的箱線圖。
Give the chart file a name.png(file = "boxplot_with_notch.png")# Plot the chart.boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders", ylab = "Miles Per Gallon", main = "Mileage Data", notch = TRUE, varwidth = TRUE, col = c("green","yellow","purple"), names = c("High","Medium","Low"))# Save the file.dev.off()
當(dāng)我們執(zhí)行上面的代碼袋倔,它產(chǎn)生以下結(jié)果 -