《R语言数据挖掘:实用项目解析》——导读
随着数据规模和种类的增长,应用数据挖掘技术从大数据中提取有效信息变得至关重要。这是因为企业认为有必要从大规模数据的实施中获得相应的投资回报。实施数据挖掘的根本性原因是要从大型数据库中发现隐藏的商机,以便利益相关者能针对未来业务做出决策。数据挖掘不仅能够帮助企业降低成本以及提高收益,还能帮助他们发现新的发展途径。
本书将介绍使用R语言(一种开源工具)进行数据挖掘的基本原理。R是一门免费的程序语言,同时也是一个提供统计计算、图形数据可视化和预测建模的软件环境,并且可以与其他工具和平台相集成。本书将结合R语言在示例数据集中的应用来阐释数据挖掘原理。
本书将阐述数据挖掘的一些主题,如数学表述、在软件环境中的实现,以及如何据此来解决商业问题。本书的设计理念是,读者可以从数据管理技术、探索性数据分析、数据可视化等内容着手学习,循序渐进,直至建立高级预测模型(如推荐系统、神经网络模型)。本书也从数据科学、分析学、统计建模以及可视化等角度对数据挖掘这一概念进行了综述。
[第1章 使用R内置数据进行数据处理
1.1 什么是数据挖掘 ](https://yq.aliyun.com/articles/117846/)
1.2 R语言引论
1.2.1 快速入门
1.2.2 数据类型、向量、数组与矩阵
1.2.3 列表管理、因子与序列
1.2.4 数据的导入与导出
1.3 数据类型转换
1.4 排序与合并数据框
1.5 索引或切分数据框
1.6 日期与时间格式化
1.7 创建新函数
1.7.1 用户自定义函数
1.7.2 内置函数
1.8 循环原理——for循环
1.9 循环原理——repeat循环
1.10 循环原理——while循环
1.11 apply原理
1.12 字符串操作
1.13 缺失值(NA)的处理
小结
[第2章 汽车数据的探索性分析
2.1 一元分析 ](https://yq.aliyun.com/articles/117913/)
2.2 二元分析
2.3 多元分析
2.4 解读分布和变换
2.4.1 正态分布
2.4.2 二项分布
2.4.3 泊松分布
2.5 解读分布
2.6 变量分段
2.7 列联表、二元统计及数据正态性检验
2.8 假设检验
2.8.1 总体均值检验
2.8.2 双样本方差检验
2.9 无参数方法
2.9.1 Wilcoxon符号秩检验
2.9.2 Mann-Whitney-Wilcoxon检验
2.9.3 Kruskal-Wallis检验
小结
相关文章
- 新闻发布项目——Servlet类(doDelCategoryServlet )
- 把gitosis-admin项目从一台机器迁移到另一台机器( git 2.30.2)
- python-django框架-电商项目-购物车模块开发_20191125
- go语言项目如何引用依赖Github上的开源项目
- Visual Studio 项目目录下的bin目录和 obj目录
- [BI项目记]-搭建代码管理环境之创建团队项目
- Atitit 多语言互相调用总结mltlan invk现在我们开发项目往往会采用多种语言,各取所长 组合使用。。常常需要互相调用为什么会调用多种语言?1.开发效率与可读性 ,一种情况是实现同
- Atitit prj tek dfkt 项目常见技术难点目录第一章 开发效率 2第一节 更加简单的语言 2第二节 简单
- Atitit 项目中的俩大孤岛问题 项目孤岛 编程语言孤岛 项目管理 目录 1. 孤岛效应1 1.1. 功能重复建设 不同项目组,不同语言的功能重复建设1 1.2. 人员互相支援不利,项目
- atitit 音频 项目 系列功能表 音乐 v3 t67.docx Atitit 音频 项目 系列功能表 1.音频 音乐 语言领域的功能表 听歌识曲功能 酷我功能。 铃声 功能。。 音频切割(按
- Atitit java项目常用类库表 目录 1. Ati总的常用库1 1.1. 表达式,语言解析类库1 1.2. 字符串模板解析库velocity freemark1 1.3. rest库
- Atitit 纯java项目的提升进度大法---通用json dsl接口
- Atitit 项目语言的选择 java c#.net php??
- Android项目持续集成实践之Gitlab CI
- 【项目实战】MyBatis-Plus中QueryWrapper和LambdaQueryWrapper介绍
- [手游项目3]-9-Go语言sync.Map(在并发环境中使用的map)
- 项目进度管理
- Go语言精进自学系列 | 使用得到公认且广泛使用的项目结构
- 严重性 代码 说明 项目 文件 行 禁止显示状态 警告 CS8032 无法从...创建分析器...的实例: 未能加载文件或程序集...或它的某一个依赖项。系统找不到指定的文件
- java做web项目比较多
- Opencv项目实战:16 虚拟拖拽系统