《R语言数据挖掘:实用项目解析》——导读
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的导读,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看
![3d585ddb22ab301c5a26c0ff5dbf2dbe5734ef7b](https://yqfile.alicdn.com/3d585ddb22ab301c5a26c0ff5dbf2dbe5734ef7b.jpeg)
目 录
前言
第1章 使用R内置数据进行数据处理
1.1 什么是数据挖掘
1.2 R语言引论
1.2.1 快速入门
1.2.2 数据类型、向量、数组与矩阵
1.2.3 列表管理、因子与序列
1.2.4 数据的导入与导出
1.3 数据类型转换
1.4 排序与合并数据框
1.5 索引或切分数据框
1.6 日期与时间格式化
1.7 创建新函数
1.7.1 用户自定义函数
1.7.2 内置函数
1.8 循环原理——for循环
1.9 循环原理——repeat循环
1.10 循环原理——while循环
1.11 apply原理
1.12 字符串操作
1.13 缺失值(NA)的处理
小结
第2章 汽车数据的探索性分析
2.1 一元分析
2.2 二元分析
2.3 多元分析
2.4 解读分布和变换
2.4.1 正态分布
2.4.2 二项分布
2.4.3 泊松分布
2.5 解读分布
2.6 变量分段
2.7 列联表、二元统计及数据正态性检验
2.8 假设检验
2.8.1 总体均值检验
2.8.2 双样本方差检验
2.9 无参数方法
2.9.1 Wilcoxon符号秩检验
2.9.2 Mann-Whitney-Wilcoxon检验
2.9.3 Kruskal-Wallis检验
小结
第3章 可视化diamond数据集
3.1 使用ggplot2可视化数据
3.1.1 条状图
3.1.2 盒状图
3.1.3 气泡图
3.1.4 甜甜圈图
3.1.5 地理制图
3.1.6 直方图
3.1.7 折线图
3.1.8 饼图
3.1.9 散点图
3.1.10 堆叠柱形图
3.1.11 茎叶图
3.1.12 词云
3.1.13 锯齿图
3.2 使用plotly
3.2.1 气泡图
3.2.2 用plotly画条状图
3.2.3 用plotly画散点图
3.2.4 用plotly画盒状图
3.2.5 用plotly画极坐标图
3.2.6 用plotly画极坐标散点图
3.2.7 极坐标分区图
3.3 创建地理制图
小结
第4章 用汽车数据做回归
4.1 回归引论
4.1.1 建立回归问题
4.1.2 案例学习
4.2 线性回归
4.3 通过逐步回归法进行变量选取
4.4 Logistic回归
4.5 三次回归
4.6 惩罚回归
小结
第5章 基于产品数据的购物篮分析
5.1 购物篮分析引论
5.1.1 什么是购物篮分析
5.1.2 哪里会用到购物篮分析
5.1.3 数据要求
5.1.4 前提假设/要求
5.1.5 建模方法
5.1.6 局限性
5.2 实际项目
5.2.1 先验算法
5.2.2 eclat算法
5.2.3 可视化关联规则
5.2.4 实施关联规则
小结
第6章 聚类电商数据
6.1 理解客户分类
6.1.1 为何理解客户分类很重要
6.1.2 如何对客户进行分类
6.2 各种适用的聚类方法
6.2.1 K均值聚类
6.2.2 层次聚类
6.2.3 基于模型的聚类
6.2.4 其他聚类算法
6.2.5 聚类方法的比较
参考文献
小结
第7章 构建零售推荐引擎
7.1 什么是推荐
7.1.1 商品推荐类型
7.1.2 实现推荐问题的方法
7.2 前提假设
7.3 什么时候采用什么方法
7.4 协同过滤的局限
7.5 实际项目
小结
第8章 降维
8.1 为什么降维
8.2 降维实际项目
8.3 有参数法降维
参考文献
小结
第9章 神经网络在医疗数据中的应用
9.1 神经网络引论
9.2 理解神经网络背后的数学原理
9.3 用R语言实现神经网络
9.4 应用神经网络进行预测
9.5 应用神经网络进行分类
9.6 应用神经网络进行预测
9.7 神经网络的优缺点
参考文献
小结
相关文章
- WinForm多语言版本实战项目演练
- 从.net framework 到 .net core:车家号项目的升级过程及经验
- Github上优秀的Objective-C项目简介
- C#写的NoSQL开源项目/系统(系列)
- Maven WEB项目使用ProGuard进行混淆,最佳解决方案
- VRRP+MSTP项目实例
- go语言项目如何引用依赖Github上的开源项目
- go语言项目如何引用依赖Github上的开源项目
- Atitit prj tek dfkt 项目常见技术难点目录第一章 开发效率 2第一节 更加简单的语言 2第二节 简单
- Atitit 项目中的俩大孤岛问题 项目孤岛 编程语言孤岛 项目管理 目录 1. 孤岛效应1 1.1. 功能重复建设 不同项目组,不同语言的功能重复建设1 1.2. 人员互相支援不利,项目
- Atitit 项目高扩展法 目录 1. 提升语言级别1 1.1. 脚本化 dsl化 免编译2 1.2. 提升语言级别到4gl2 1.3. 语言的代际关系 sql 》script 》java2
- atitit 音频 项目 系列功能表 音乐 v3 t67.docx Atitit 音频 项目 系列功能表 音频 音乐 语言领域的功能表 听歌识曲功能 酷我功能。 铃声 功能。。 音频切割(按照副歌部
- Atitit 项目语言的选择 java c#.net php??
- Angular 如何为多个项目使用单一存储仓库
- Python语言学习:Python语言学习之程序打包发布(exe/msi等)&如何将自己的Python项目(自定义程序代码库)发布到PyPI全流程的简介、案例应用之详细攻略
- Python实现贝叶斯优化器(Bayes_opt)优化随机森林回归模型(RandomForestRegressor算法)项目实战
- Python实现贝叶斯优化器(Bayes_opt)优化循环神经网络回归模型(LSTM回归算法)项目实战
- 【项目实战】Python实现AdaBoost分类模型(AdaBoostClassifier算法)项目实战
- 【项目实战】Python实现基于LDA主题模型进行电商产品评论数据情感分析
- [手游项目3]-12-Go 语言 select 语句
- [手游项目3]-10-Go语言atomic原子操作
- Springboot的项目如何打成war包
- Go语言精进自学系列 | 使用得到公认且广泛使用的项目结构
- 387集Go语言核心编程培训视频教材整理 | 家庭收支记账项目
- DL项目代码目录结构管理
- 【项目实战】Vue.js入门介绍