R語言盒形圖(箱形圖)
盒形圖是數據集中數據分佈情況的衡量標準。它將數據集分爲三個四分位數。盒形圖表示數據集中的最小值,最大值,中值,第一四分位數和第四四分位數。 通過爲每個數據集繪製箱形圖,比較數據集中的數據分佈也很有用。
R中的盒形圖通過使用boxplot()
函數來創建。
語法
在R中創建盒形圖的基本語法是 -
boxplot(x, data, notch, varwidth, names, main)
以下是使用的參數的描述 -
- x - 是向量或公式。
- data - 是數據幀。
- notch - 是一個邏輯值,設置爲
TRUE
可以畫出一個缺口。 - varwidth - 是一個邏輯值。設置爲
true
以繪製與樣本大小成比例的框的寬度。 - names - 是將在每個箱形圖下打印的組標籤。
- main - 用於給圖表標題。
示例
我們使用R環境中已經存在的數據集 - mtcars
來創建一個基本的盒形圖。下面來看看mtcars
數據集中的mpg
和cyl
列。
input <- mtcars[,c('mpg','cyl')]
print(head(input))
當我們執行上面的代碼,它產生以下結果 -
mpg cyl
Mazda RX4 21.0 6
Mazda RX4 Wag 21.0 6
Datsun 710 22.8 4
Hornet 4 Drive 21.4 6
Hornet Sportabout 18.7 8
Valiant 18.1 6
創建盒形圖
以下腳本將爲mpg
(每加侖英里)和cyl
(氣缸數)列之間的關係創建一個盒形圖。
setwd("F:/worksp/R")
# Give the chart file a name.
png(file = "boxplot.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "氣缸數",
ylab = "每加侖里程", main = "里程數據")
# Save the file.
dev.off()
當我們執行上述代碼時,會產生以下結果 -
盒形圖與凹口
我們可以繪製帶有凹槽的盒形圖,以瞭解不同數據組的中位數如何相互匹配。以下腳本將爲每個數據組創建一個帶有凹槽的盒形圖形。
setwd("F:/worksp/R")
# Give the chart file a name.
png(file = "boxplot_with_notch.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars,
xlab = "氣缸數",
ylab = "每加侖里程",
main = "里程數據",
notch = TRUE,
varwidth = TRUE,
col = c("green","yellow","purple"),
names = c("高","中","低")
)
# Save the file.
dev.off()
當我們執行上述代碼時,會產生以下結果 -