《机器学习与数据科学(基于R的统计学习方法)》——2.14 写数据
2023-09-11 14:17:45 时间
本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.14节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。
2.14 写数据在一个机器学习项目中工作时,虽然数据科学家做的通常都是将外部文件导入R中,但有时在R环境下把数据写到外部文件中也是很有必要的。好在,我们在本章中见过的很多用于数据连接的R包都提供了写文件的功能。例如,write.table()函数能写一个CSV文件。在下面的例子中,我们将用R移除数据框的第一列(变量POST_ID),并写出一个不包含这个变量的新版CSV文件。然后,仅仅为了证明它真的有效,我们将新的CSV文件读回R中,然后使用head()来展示它的前几行。
tempDF - SFParkingMeters[,-1] # Remove POST_ID variable write.table(tempDF, file="./data/newSFParkingMeters.csv", sep=",") newSFParkingMeters - read.table("./data/newSFParkingMeters.csv", sep=",") head(newSFParkingMeters) MS_ID MS_SPACEID CAP_COLOR METER_TYPE SMART_METE ACTIVESENS JURISDICTI ON_OFF_STR 1 - 0 Grey SS Y Y SFMTA ON 2 - 0 Green SS Y Y SFMTA ON 3 - 0 Yellow SS Y Y SFMTA ON 4 - 0 Grey SS N N SFMTA ON 5 - 0 Grey SS N N SFMTA ON 6 - 0 Grey SS Y Y SFMTA ON OSP_ID STREET_NUM STREETNAME STREET_SEG RATEAREA SFPARKAREA 1 0 2016 CHESTNUT ST 3977000 Area 5 Marina 2 0 2103 CHESTNUT ST 3979000 Area 5 Marina 3 0 2116 CHESTNUT ST 3979000 Area 5 Marina 4 0 525 COLUMBUS AVE 4295000 Area 3 5 0 527 COLUMBUS AVE 4295000 Area 3 6 0 412 HAYES ST 6816000 Area 5 Civic Center LOCATION 1 (37.800798, -122.43687) 2 (37.800522, -122.438067) 3 (37.800589, -122.438525) 4 (37.800053, -122.409985) 5 (37.800088, -122.410035) 6 (37.776878, -122.423512)
同样地,xlsx包的write.xlsx()函数、rjson包的toJSON()等,都能实现类似的功能。
机器学习数学基础五:数据科学的一些基本分布 每一次尝试都是独立的,因为前一次投掷的结果不能决定或影响当前投掷的结果。只有两个可能的结果并且重复n次的实验叫做项式。二项分布的参数是n和p,其中n是试验的总数,p是每次试验成功的概率。
边玩边学!交互式可视化图解!快收藏这18个机器学习和数据科学网站!⛵ 机器学习算法理论比较枯燥乏味,但有许多有趣且有用的网站,您可以像游戏一样交互式操作,并同时学习机器学习概念、模型和应用知识。以下是 ShowMeAI 为大家整理的18个交互式机器学习网站,学起来!
五个给机器学习和数据科学入门者的学习建议 我从没写过代码。 当人们发现我的作品,他们通常会私信并提问。我不一定知道所有的答案,但我会尽量回复。人们最常问的问题是:「该从哪开始?」,其次是:「我需要多少数学基础?」
异步社区 异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
相关文章
- (《机器学习》完整版系列)第7章 贝叶斯分类器——7.10 EM算法的使用场景及步骤(反复循环执行E步和M步)
- 机器学习笔记之粒子滤波(二)基于序列重要性采样的重采样
- 利用机器学习技术进行图像识别
- 大数据与机器学习:实践方法与行业案例1.1 数据的基本形态
- 演讲实录丨侯晓迪 机器视觉:从跑分到跑路
- 《机器学习与数据科学(基于R的统计学习方法)》——1.1 机器学习的分类
- 《机器学习与数据科学(基于R的统计学习方法)》——1.4 机器学习背后的数学
- 《机器学习与数据科学(基于R的统计学习方法)》——1.8 使用R包
- 《机器学习与数据科学(基于R的统计学习方法)》——1.11 小结
- 《机器学习与数据科学(基于R的统计学习方法)》——2.3 数据的来源
- 《机器学习与数据科学(基于R的统计学习方法)》——2.4 从网络中下载数据集
- 《机器学习与数据科学(基于R的统计学习方法)》——2.5 读取CSV文件
- 《机器学习与数据科学(基于R的统计学习方法)》——导读
- 《机器学习导论》和《统计机器学习》学习资料:张志华教授
- Python3机器学习之02通过计算熵来选择分组
- 机器学习算法: 基于逻辑回归的分类预测Python实现
- 机器学习中的MC、MCMC、Gibbs采样
- 计组 | 周期大杂烩 —— 指令周期、时钟周期(节拍周期)、机器周期(CPU周期)等
- 机器学习实战(Machine Learning in Action)笔记--Chapter1:机器学习基础
- 机器学习——常用核函数