《R语言数据分析》——1.6 导入Excel电子表格
在学术界和商业界,除了CSV文件,Excel的xls(或xlsx,最近的一种新称呼)应该是应用最为广泛的进行存储和交换少量数据最为通用的数据格式。它最初源自Microsoft公司独有的二进制文件格式,对其文档的说明非常多(xls指南长达1100页,50M),但是对多种表格、宏及公司的导入不直接,目前为止也是这样。本节将仅探讨与Excel交互的与平台无关的R包。
一种选择是使用前面介绍过的RODBC包,与Excel驱动器交互,查询Excel电子表格。还可以借助第三方工具来访问Excel数据,例如使用Perl自动将Excel文件转换为CSV文件,然后再通过gdata包的read.xls函数导入到R。但有时候在Windows安装Perl过程比较繁琐,因此更多的时候,在Windows平台上人们会使用RODBC。
一些平台独立的基于Java的解决方案也提供了对Excel文件的读写操作,特别是对xlsx文件和Off?ice Open XML文件格式。在CRAN上提供了xlConnect和xlsx两个包来分别读取Excel 2007 以及97/2000/XP/2003文件。这两个包都使用了Apache POI Java API项目,需要主动维护。可以运行在任何支持Java的平台上,而不需要再另外安装Microsoft Excel或Off?ice程序。
另一方面,如果你不希望程序依赖于Perl或Java,则可以使用最新发布的openxlsx包。Hadley Wickham也发布了一个功能相似的包,但是稍微有所变化:readxl包能够读(不能写)xls和xlsx格式的文件。
记住:要为自己的应用选择最合适的工具!例如,如果要读取Excel文件而不希望依赖其他程序,我会选择readxl包,但如果要写入Excel 2003电子表格,并且要进行单元运算或者使用其他一些高级功能,有可能我们不能保存Java依赖关系,就应该选择xlConnect或xlsx包,而非openxlsx包。
数据分析必备的43个 Excel 函数! Excel是我们工作中经常使用的一种工具,对于数据分析来说,这也是处理数据最基础的工具。很多传统行业的数据分析师甚至只要掌握Excel和SQL即可。
数据分析实战——EXCEL实现复购率计算 复购率指消费者对该品牌产品或者服务的重复购买次数,重复购买率越多,则反应出消费者对品牌的忠诚度就越高,反之则越低。
相关文章
- excel测试数据导入
- 我是陌生人 Java中导入、导出Excel
- 使用Excel绘制F分布概率密度函数图表
- EXCEL函数常用技巧浅析
- ThinkPHP使用PHPExcel实现Excel数据导入导出完整实例
- piap.excel 微软 时间戳转换mssql sql server文件时间戳转换unix 导入mysql
- piap.excel 微软 时间戳转换mssql sql server文件时间戳转换unix 导入mysql
- 小程序中实现excel数据的批量导入
- Python编程语言学习:如何将excel表格内的科学计数法转为常规数值并全部显示?
- SpringBoot中使用Easyexcel实现Excel导入导出功能(二)
- excel加双引号和逗号
- Vue2.js:xlsx实现Excel文件的导入导出
- 前端必备技能知识:JS导出Blob流文件为Excel表格、Vue.js使用Blob的方式实现excel表格的下载(流文件下载)
- 在线EXCEL绝配:SpreadJS 16.0.3 + GcExcel Java 6.0.3
- SpringBoot中使用Easyexcel实现Excel导入导出功能(一)