R語言平均值,中位數和衆數

R中的統計分析通過使用許多內置函數來執行的。這些函數大部分是R基礎包的一部分。這些函數將R向量與參數一起作爲輸入,並在執行計算後給出結果。

我們在本章中討論的是如何求平均值,中位數和衆數。下面將分別一個個演示和講解 -

1.平均值

平均值是通過取數值的總和併除以數據序列中的值的數量來計算。函數mean()用於在R中計算平均值。

語法

R中計算平均值的基本語法是 -

mean(x, trim = 0, na.rm = FALSE, ...)

以下是使用的參數的描述 -

  • x - 是輸入向量。
  • trim - 用於從排序的向量的兩端刪除一些觀測值。
  • na.rm - 用於從輸入向量中刪除缺少的值。

示例

# Create a vector. 
x <- c(17,8,6,4.12,11,8,54,-11,18,-7)

# Find Mean.
result.mean <- mean(x)
print(result.mean)

當我們執行上述代碼時,會產生以下結果 -

[1] 10.812

1.1.應用修剪選項

當提供trim參數時,向量中的值進行排序,然後從計算平均值中刪除所需數量的觀察值。

例如,當trim = 0.3時,每一端的3個值將從計算中刪除以找到均值。

在這種情況下,排序的向量爲(-21,-5,2,3,42,7,8,12,18,54),從用於計算平均值的向量中從左邊刪除:(-21,-5,2)和從右邊刪除:(12,18,54)這幾個值。

# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find Mean.
result.mean <-  mean(x,trim = 0.3)
print(result.mean)

當我們執行上述代碼時,會產生以下結果 -

[1] 5.55

1.2.應用NA選項

如果缺少值,則平均函數返回NA。要從計算中刪除缺少的值,請使用na.rm = TRUE。 這意味着刪除NA值。參考以下示例代碼 -

# Create a vector. 
x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA)

# Find mean.
result.mean <-  mean(x)
print(result.mean)

# Find mean dropping NA values.
result.mean <-  mean(x,na.rm = TRUE)
print(result.mean)

當我們執行上述代碼時,會產生以下結果 -

[1] NA
[1] 8.22

2.中位數

數據系列中的中間值被稱爲中位數。R中使用median()函數來計算中位數。

語法

R中計算位數的基本語法是 -

median(x, na.rm = FALSE)

以下是使用的參數的描述 -

  • x - 是輸入向量。
  • na.rm - 用於從輸入向量中刪除缺少的值。

示例

# Create the vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find the median.
median.result <- median(x)
print(median.result)

當我們執行上述代碼時,會產生以下結果 -

[1] 5.6

3.衆數

衆數是指給定的一組數據集合中出現次數最多的值。不同於平均值和中位數,衆數可以同時具有數字和字符數據。

R沒有標準的內置函數來計算衆數。因此,我們將創建一個用戶自定義函數來計算R中的數據集的衆數。該函數將向量作爲輸入,並將衆數值作爲輸出。

示例

# Create the function.
getmode <- function(v) {
   uniqv <- unique(v)
   uniqv[which.max(tabulate(match(v, uniqv)))]
}

# Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)

# Calculate the mode using the user function.
result <- getmode(v)
print(result)

# Create the vector with characters.
charv <- c("baidu.com","tmall.com","yiibai.com","qq.com","yiibai.com")

# Calculate the mode using the user function.
result <- getmode(charv)
print(result)

當我們執行上述代碼時,會產生以下結果 -

[1] 2
[1] "yiibai.com"