《R语言数据挖掘:实用项目解析》——第1章,第1.6节日期与时间格式化
2023-09-11 14:16:11 时间
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第1章,第1.6节日期与时间格式化,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看
1.6 日期与时间格式化
日期函数返回的是一个Date类,表示自1970年1月1日以来的天数。as.numeric()函数可用于创建一个值为自1/1/1970以来的天数的数值型变量。as.Date()的返回值是一个Date类的对象:
![977476f48e2c669e83c3f8bff63b519bc0d83c48](https://yqfile.alicdn.com/977476f48e2c669e83c3f8bff63b519bc0d83c48.png)
系统时间函数提取了日期和时区时间。当用as.Date函数转换系统时间并将其存储为R中的一个新对象时,我们发现那个对象的类是Date。weekdays函数返回星期名,如“星期一”或者“星期三”。months函数返回日期变量中的月名。quarters函数返回日期对象的季名。年份值也可利用substr()命令提取。示例如下:
![9a7c4ecb1eb7e7baea3b692ab576d5c95696aff8](https://yqfile.alicdn.com/9a7c4ecb1eb7e7baea3b692ab576d5c95696aff8.png)
![dac0b5bf2ca7076d34ffcf5d54ac6a1f4a9944fe](https://yqfile.alicdn.com/dac0b5bf2ca7076d34ffcf5d54ac6a1f4a9944fe.png)
如果数据集中给出的日期变量的格式不适用于进一步计算,可以用format函数将其格式化:
![ddc9c2ad00c6d25fb18f3d66efdde091375b9008](https://yqfile.alicdn.com/ddc9c2ad00c6d25fb18f3d66efdde091375b9008.png)
下表所示的多种选项均可基于用户需求传递给格式参数。
![66e9a49e1c11ba95cc46c2a55a907d48a6c36dcc](https://yqfile.alicdn.com/66e9a49e1c11ba95cc46c2a55a907d48a6c36dcc.png)
实际数据集包含的时间数据域有零售中的交易日期、健康服务中的访问日期和BFSI中的处理日期,还有包含至少一个时间元素的时间序列数据。要将日期变量纳入任何统计模型,都需要进行数据转换,比如在零售业场景中计算顾客的历史记录。数据转换可以使用上文提及的选项完成。