漫画大数据:技术更新的一小步,迈向秃头的一大步
In Spark 3.0, the add_months function does not adjust the resulting date to a last day of month if the original date is a last day of months. For example, select add_months(DATE'2019-02-28', 1) results 2019-03-28. In Spark version 2.4 and below, the resulting date is adjusted when the original date is a last day of months. For example, adding a month to 2019-02-28 results in 2019-03-31. --- 翻译 --- 在Spark 3.0中,如果原始日期是月份的最后一天,add_months 函数不会将结果日期调整为月份的最后一天。例如,select add_months(DATE'2019-02-28',1) , 结果为 2019-03-28。在 Spark 2.4 及以下版本中,当原始日期是月份的最后一天时,结果日期会进行调整。例如,在 2019-02-28 后加上一个月,结果为 2019-03-31。
—————END—————
对了,你觉得 add_months 的哪种实现方式更好呢?
留言跟我聊聊吧~
许多数据科学家、分析师和一般的商业智能用户都依赖于交互式SQL查询来探索数据。SparkSQL是一个用于结构化数据处理的Spark模块。它提供了一种称为DataFrames的编程抽象,还可以充当分布式SQL查询引擎。它使未修改的Hadoop Hive查询在现有部署和数据上的运行速度提高了100倍。它还提供了与Spark生态系统其他部分的强大集成(例如,将SQL查询处理与机器学习集成)。
文中「澜妹、澜宝」使用了数澜的吉祥物,数澜科技:让数据用起来!
相关文章
- RDS MySQL数据库部分问题解析|阿里云产品内容精选(十四)
- golang 系列:深入认识 map!
- 不少电脑被迫使用Windows 10:因配置低无缘Windows 11 想升升不了
- OpenHarmony性能分析工具Bytrace
- 苹果 macOS 12.2 RC 发布,修复 Safari 浏览器泄露隐私漏洞
- 如何根据 Macie 检测结果为 S3 自动打上自定义敏感数据标签?
- Oracle On EC2 多租户架构轻松、高效整合数据库上云
- java--Java数组
- 利用 Lambda 将 Kinesis Data Stream 数据批量自动写入 MSK
- 新增功能 – AWS CloudTrail Lake 支持从非 AWS 来源摄取活动事件
- 基于 Redshift 和 Grafana 搭建实时大屏应用
- 使用 Lettuce 和 Redisson 对 Amazon Multi-AZ ElastiCache for Redis 实现就近读取
- 【java】java String 源码
- 【Python】------- Python 列表 list方法
- 使用 Kafka Connect 简化数据采集管道
- Amazon EMR HBase on S3 之二级索引、Thrift 和性能评测
- 使用 Amazon DocumentDB 和 Amazon MSK 通过 Kafka 连接器流式传输数据
- 使用 Amazon MSK Serverless 拆分整体式 Apache Kafka 集群
- 使用 AWS Glue DataBrew 和 Amazon QuickSight 简化半结构化嵌套 JSON 数据分析
- 使用 AWS DMS 将 Google Cloud for MySQL 迁移到 Amazon Aurora MySQL