R語言Excel文件

Microsoft Excel是使用最廣泛的電子表格程序,它是以.xls.xlsx格式存儲數據。 R可以使用某些excel特定的包直接讀取這些文件的內容。一些常用的軟件包有 - XLConnectxlsxgdata等。在這個篇文章中,我們將使用xlsx軟件包。 R也可以使用這個包寫入excel文件。

安裝xlsx軟件包

可以在R控制檯中使用以下命令來安裝xlsx軟件包。它可能會要求安裝一些這個包所依賴的附加包。按照相同的命令與所需的包名來安裝附加的包。

install.packages("xlsx")

驗證並加載「xlsx」軟件包

使用以下命令來驗證和加載xlsx包。參考以下代碼 -

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

當腳本運行時,得到以下輸出 -

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

注: 如果第一個輸出結果爲:FALSE,請 install.packages("xlsx") 語句重新加載安裝。

準備xlsx文件用作爲輸入

打開Microsoft excel。將以下數據複製並粘貼到名爲sheet1的工作表中。

id    name      salary    start_date    dept
1    Rick      623.3        1/1/2012    IT
2    Dan       515.2     9/23/2013   Operations
3    Michelle  611        11/15/2014    IT
4    Ryan      729        5/11/2014    HR
5    Gary      843.25    3/27/2015    Finance
6    Nina      578       5/21/2013    IT
7    Simon      632.8        7/30/2013    Operations
8    Guru      722.5        6/17/2014    Finance

如下所示 -

R語言Excel文件

還將以下數據複製並粘貼到另一個工作表,並將此工作表重命名爲city

name     city
Rick     Seattle
Dan      Tampa
Michelle Chicago
Ryan     Seattle
Gary     Houston
Nina     Boston
Simon     Mumbai
Guru     Dallas

如下所示 -

R語言Excel文件

將Excel文件另存爲「input.xlsx」,應該將此文件保存在R工作區的當前工作目錄中。

讀取Excel文件

使用read.xlsx()函數讀取input.xlsx,如下所示,結果作爲數據幀存儲在R環境中。

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

當我們執行上述代碼時,會產生以下結果 -

  id     name salary start_date       dept
1  1     Rick 623.30 2012-01-01         IT
2  2      Dan 515.20 2013-09-23 Operations
3  3 Michelle 611.00 2014-11-15         IT
4  4     Ryan 729.00 2014-05-11         HR
5 NA     Gary 843.25 2015-03-27    Finance
6  6     Nina 578.00 2013-05-21         IT
7  7    Simon 632.80 2013-07-30 Operations
8  8     Guru 722.50 2014-06-17    Finance