《Clojure数据分析秘笈》——1.3节将CSV数据读入Incanter数据集
本节书摘来自华章社区《Clojure数据分析秘笈》一书中的第1章,第1.3节将CSV数据读入Incanter数据集,作者(美)Eric Rochester,更多章节内容可以访问云栖社区“华章社区”公众号查看
1.3 将CSV数据读入Incanter数据集
以逗号分隔值(CSV)是最简单的数据格式之一,并且这种数据格式应用非常普遍。Excel可以直接读写CSV文件,而且多数数据库也可以。由于CSV文件就是无格式的文本,因此使用任何编程语言都很容易生成或者访问它。
1.3.1 准备工作
首先,确保加载了正确的库。Leiningen(https://github.com/technomancy/leiningen)的项目文件project.clj file应该包含以下依赖(也可以使用更新的版本):
![d2c4138f7682db0e44d844709de3a618ecf6ddf4](https://yqfile.alicdn.com/d2c4138f7682db0e44d844709de3a618ecf6ddf4.png)
这个文件可以从http://www.ericrochester.com/clj-data-analysis/data/small-sample.csv下载,还有一个带有标题行的版本,可以从http://www.ericrochester.com/clj-data-analysis/data/small-sample-header.csv下载。
1.3.2 具体实现
1.3.3 实现原理
通过Clojure和Incanter可以使许多普通工作变得简单,下面是一个很好的例证。
读入外部数据(在本例中来自CSV文件),并将其加载到Incanter数据集中。在Incanter中,一个数据集就是一张表,类似于电子表格中的一个表单或者数据库中的表。每一列包含一个数据域,每一行包含一条数据。有些列包含字符串数据(本例中所有列都是字符串数据),有些列包含日期或者数值数据。如果一列包含数值数据,Incanter会自动将其检测出来并将其转换为Java中的int或者double数据格式。Incanter解决了导入数据过程中遇到的许多令人头疼的问题。
1.3.4 更多信息
如果你不想涉及Incanter,比如当你不想添加依赖时,使用data.csv也是比较简单的(https://github.com/clojure/data.csv)。后续的章节中会使用这个库,例如2.8节。
《Clojure数据分析秘笈》——导读 本节书摘来自华章社区《Clojure数据分析秘笈》一书中的目录,作者(美)Eric Rochester,更多章节内容可以访问云栖社区“华章社区”公众号查看
相关文章
- Simulink仿真中将工作空间中的数据变量保存成.mat文件
- Google Earth Engine——EOSDIS下产生或收集的海洋颜色和卫星海洋生物数据
- excel数据导入SQLite数据库
- 91 网站点击流数据分析案例(数据展示)
- 华为数通笔记-组播数据转发原理
- “大数据”模式的法律风险
- 分享数据亦是慈善之举
- 在大数据场景下借鉴Splunk SPL的提供通用的数据分析手段
- 一个php文件就可以把数据库的数据导出Excel表格
- 《数据分析变革:大数据时代精准决策之道》一1.1 定义运营型分析
- 《数据分析实战 基于EXCEL和SPSS系列工具的实践》一3.2 用“逐步推进法”推测需要的数据
- 《数字营销解析——揭开用户数据背后的秘密》一导读
- 《数据科学与大数据分析——数据的发现 分析 可视化与表示》一2.3 第2阶段:数据准备
- 《Hadoop实战手册》一1.7 从HDFS导出数据到MongoDB
- 《Clojure数据分析秘笈》——1.9节从网页中抓取文本数据
- Python数据分析之不只是拟合数据,还要获得洞察力,轻量级的 Python包可以让您深入了解回归问题
- (数据科学学习手札72)用pdpipe搭建pandas数据分析流水线
- 大数据学习——课后练习一
- 搭建大数据应用平台 运营商具有天然的优势
- CYQ.Data 轻量数据层之路 继续狂热升级(三)
- 高新区 中国智慧城市大数据创新联盟揭牌
- 大数据营销分析公司Amplero获得800万美元A轮融资
- 一文解锁华为云新技能-AIOT开发全流程【设备接入-ESP端侧数据收集[MQTT]-实时数据分析】(步步截图较详细)
- 李涛:深度解读大数据时代的数据挖掘
- 电商 商品数据分析 市场洞察 导出数据后 横线对比 python实现