《机器学习与数据科学(基于R的统计学习方法)》——2.15 小结
2023-09-11 14:17:45 时间
本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.15节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。
2.15 小结在本章中,我们了解了为何数据源是机器学习方程的命脉。我们介绍了许多连接原始数据并将其导入R环境中以用于机器学习算法的方法。下一步将会是“加工”这些原始数据,便于你选择的算法能够使用数据。这叫做“数据处理”,这是第3章的主题。
下面是本章主要内容的小结:
机器学习用的数据以各种形式存在,仅举几例,包括CSV、Excel和JSON。
使用各种各样的R包,你可以直接连接以SQL数据库表形式存在的数据。
来自像Twitter这样的社交媒体的数据已经成为机器学习应用流行的数据源。在R的帮助下,你可以很容易地连接Twitter作为数据源。
谷歌分析代表了另一种激动人心的机器学习数据源。
你可以非常容易地将数据从R中写到外部文件中。
异步社区 异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
相关文章
- 机器学习--常用的特征工程方法
- 机器学习-随机性、概率论、多元统计、特征间的相关性
- (《机器学习》完整版系列)第7章 贝叶斯分类器——7.2 再谈线性判别分析(高斯分布下的线性判别分析LDA实现了贝叶斯分类器)
- (《机器学习》完整版系列)第2章 模型评估与选择 ——2.8 学习器的比较(除用ROC等工具外,还可用统计检验手段)
- 哈希函数1:用于资源限制类机器统计文件或词频
- 机器学习笔记之玻尔兹曼机(三)基于平均场理论变分推断的梯度求解(续)
- 机器学习笔记之指数族分布——充分统计量与模型参数的关系
- 17张思维导图,一网打尽机器学习统计基础(附下载)
- 关于机器学习和网络安全的一些资料
- 《面向机器智能的TensorFlow实践》一1.2 深度学习
- 《面向机器智能的TensorFlow实践》一2.7 安装matplotlib
- 阿里亿级并发册 + 机器学习算法 + 面试册 + 优化册 + 代码册 笔记!!!
- 2019年上半年收集到的人工智能机器学习方向干货文章
- 《机器学习与数据科学(基于R的统计学习方法)》——1.4 机器学习背后的数学
- 《机器学习与数据科学(基于R的统计学习方法)》——2.2 数据文件的种类
- 《机器学习与数据科学(基于R的统计学习方法)》——2.7 使用文件连接
- 《机器学习与数据科学(基于R的统计学习方法)》——2.8 读取JSON文件
- 《机器学习与数据科学(基于R的统计学习方法)》——2.12 读取Twitter数据
- 《机器学习与数据科学(基于R的统计学习方法)》——2.14 写数据
- 《机器学习导论》和《统计机器学习》学习资料:张志华教授
- 如何在没有装VS(Visual Studio)的机器上编译运行C#程序
- 不成功的RMAN恢复到其他机器的例子
- 机器手臂(3):机械手臂底座
- 机器学习实战(Machine Learning in Action)笔记--Chapter1:机器学习基础