R Excel文件

Microsoft Excel是最广泛使用的电子表格程序,以.xls或.xlsx格式存储数据。 R语言可以直接从这些文件使用一些excel特定的包。 很少这样的包是 - XLConnect,xlsx,gdata等。我们将使用xlsx包。 R语言也可以使用这个包写入excel文件。

安装xlsx软件包

您可以在R控制台中使用以下命令来安装“xlsx”软件包。 它可能会要求安装一些额外的软件包这个软件包依赖。 按照具有所需软件包名称的同一命令安装其他软件包。

  1. install.packages("xlsx")

验证并加载“xlsx”软件包

使用以下命令验证并加载“xlsx”软件包。

  1. # Verify the package is installed.
  2. any(grepl("xlsx",installed.packages()))
  3. # Load the library into R workspace.
  4. library("xlsx")

当脚本运行,我们得到以下输出。

  1. [1] TRUE
  2. Loading required package: rJava
  3. Loading required package: methods
  4. Loading required package: xlsxjars

输入为xlsx文件

打开Microsoft Excel。 将以下数据复制并粘贴到名为sheet1的工作表中。

  1. id name salary start_date dept
  2. 1 Rick 623.3 1/1/2012 IT
  3. 2 Dan 515.2 9/23/2013 Operations
  4. 3 Michelle 611 11/15/2014 IT
  5. 4 Ryan 729 5/11/2014 HR
  6. 5 Gary 843.25 3/27/2015 Finance
  7. 6 Nina 578 5/21/2013 IT
  8. 7 Simon 632.8 7/30/2013 Operations
  9. 8 Guru 722.5 6/17/2014 Finance

还要将以下数据复制并粘贴到另一个工作表,并将此工作表重命名为“city”。

  1. name city
  2. Rick Seattle
  3. Dan Tampa
  4. Michelle Chicago
  5. Ryan Seattle
  6. Gary Houston
  7. Nina Boston
  8. Simon Mumbai
  9. Guru Dallas

将Excel文件另存为“input.xlsx”。 应将其保存在R工作区的当前工作目录中。

读取Excel文件

通过使用read.xlsx()函数读取input.xlsx,如下所示。 结果作为数据帧存储在R语言环境中。

  1. # Read the first worksheet in the file input.xlsx.
  2. data <- read.xlsx("input.xlsx", sheetIndex = 1)
  3. print(data)

当我们执行上面的代码,它产生以下结果:

  1. id, name, salary, start_date, dept
  2. 1 1 Rick 623.30 2012-01-01 IT
  3. 2 2 Dan 515.20 2013-09-23 Operations
  4. 3 3 Michelle 611.00 2014-11-15 IT
  5. 4 4 Ryan 729.00 2014-05-11 HR
  6. 5 NA Gary 843.25 2015-03-27 Finance
  7. 6 6 Nina 578.00 2013-05-21 IT
  8. 7 7 Simon 632.80 2013-07-30 Operations
  9. 8 8 Guru 722.50 2014-06-17 Finance