您现在的位置是：首页 > 其他

当前栏目

MaxCompute - ODPS重装上阵　第一弹 - 善用MaxCompute编译器的错误和警告

错误编译器第一警告重装 MaxCompute 善用 ODPS

2023-09-27 14:27:26 时间

MaxCompute (ODPS) ( __注1__ )是阿里云自主研发的具有业界领先水平的分布式大数据处理平台, 尤其在集团内部得到广泛应用，支撑了多个BU的核心业务。 ODPS2.0除了持续优化性能外，也致力于提升SQL语言的用户体验和表达能力，提高广大ODPS开发者的生产力。

MaxCompute (ODPS) ( 注1 )是阿里云自主研发的具有业界领先水平的分布式大数据处理平台, 尤其在集团内部得到广泛应用，支撑了多个BU的核心业务。 ODPS2.0除了持续优化性能外，也致力于提升SQL语言的用户体验和表达能力，提高广大ODPS开发者的生产力。

基于ODPS2.0新一代的SQL引擎，MaxCompute显著提升了SQL语言编译过程的易用性与语言的表达能力。
我们在此推出MaxCompute(ODPS2.0)重装上阵系列文章

第一弹 - 善用MaxCompute编译器的错误和警告
 第二弹 - 新的基本数据类型与内建函数
 第三弹 - 复杂类型
 第四弹 - CTE，VALUES，SEMIJOIN

这次首先向您介绍在易用性方面的改进。

场景1
作为ODPS的开发者，提交了一段SQL脚本，里面两句SQL，等了半天排上队，结果发现第一句里面有个函数的参数类型错误，白等了。。。；修改脚本后再次提交，排队，第一条语句用了两个小时跑完了，然后报告第二个语句漏了半边括号。。。
场景2
_我的上游数据有个表create table my_upperstream(..., id string) partitioned by (...), 我的项目每天有一个任务要和my_uppertstream在id上join，... join my_upperstream u on id = u.id，过去没有问题，最近总是发现有些数据莫名其妙的丢失，经过几天痛苦的debug，终于发现是因为我的id是bigint，在和u.id比较的时候，都竟然转成了double，因为浮点误差导致某些列join不上_( 注2 )；

怒气冲冲在ODPS用户群中中质问，竟然告诉我这个是by design！。。。

MaxCompute编译器基于ODPS2.0全新自主研发的SQL引擎，尤其配合使用MaxCompute Studio，提供了丰富的错误提示与警告的功能。可完全避免以上问题。

编译器的易用性改进

为了充分发挥MaxCompute编译器的易用性改进，最好配合MaxCompute Studio (D2平台对ODPS2.0的错误与警告的支持正在积极开发中，预计今年9月份上线，敬请期待！)。首先，请安装MaxCompute Studio，导入测试MaxCompute项目，创建工程，建立一个新的MaxCompute脚本文件, 如下

可以看到

第一个insert语句中wm_concat函数使用有错误第二个insert有一个错误和一个警告，错误是列名写错了警告则是上面场景二种提到的，ODPS中当比较bigint与double的时候，会隐含的都转为double, 因为从string到double是有可能在运行时导致错误的转换，所以MaxCompute编译器会在此警告要您确定这个是不是您希望的行为鼠标停止在错误或者警告( 注3 )上，会直接提示具体错误或者警告信息。

如果我不修改错误，直接提交，会被MaxCompute Studio挡住，如下图

按照提示修改错误和警告，如下图，

再次提交，可以顺利的运行，再也不用担心因为语法错误白等了！

事实上，使用MaxCompute Studio可以把所有警告都设定为错误，如下图

这样就可以保证不会不小心漏掉任何有可能的错误！

MaxCompute团队建议您在提交任何脚本之前，都使用MaxCompute Studio对脚本进行静态编译检查，并强烈推荐将警告设定为错误，在提交前修改所有的警告，这样可以花很少的时间避免大量花费大量计算与人力资源的错误。

除了可以帮助您节省时间外，也可以节省MaxCompute服务器端资源，目前每天MaxCompute SQL服务器花大笔计算资源在编译那些有错误的SQL，连累没有错误的也要跟着排队。

另外您知道吗？提交有错误的脚本会导致扣您的计算健康分，导致以后提交任务的优先级被下调！某些警告报告的问题也会导致扣除健康分，使用MaxCompute Compiler和Studio，可以帮助您避免此类扣分，避免被降级！

警告中很多情况是不安全的隐式类型转换，如果确实是想要的转换，可以用cast (xxx as )的方式消除警告，如果觉得这么写麻烦，MaxCompute 编译器还提供一种简洁的方式(xxx)，如上面修改过的脚本所示。具体该用哪种完全取决于您的偏好。MaxCompute还有一系列的SQL语言方面的改进，此系列会向您逐一介绍。

基于ODPS2.0 SQL引擎的MaxCompute新编译器配合MaxCompute Studio，通过完整准确地报告错误于警告，可以显著提高用户的生产力。不过提升生产力不能只靠准确的错误和警告，丰富强大的SQL语言表达能力一样重要，从下一篇开始，我们向您介绍MaxCompute在SQL语言上的各项改进！

注1 MaxCompute就是ODPS，是ODPS在阿里云上的品牌，本系列文章中，MaxCompute与ODPS可以通用。注2 为什么int = string的时候要转double呢？因为这个是Hive的行为，MaxCompute(原ODPS) 在当初第一版的时候，为了替换当时广泛使用的Hive脚本，不得不兼容。现在有了警告，只要大家按照建议的方式使用MaxCompute，在需要的时候修改提示的问题，就不会再掉进这个坑里了！注3 对于警告的标注，我的设定是黄色波浪线，可以通过IntelliJ的Settings来修改，如下

使用DataWorks将PolarDB-X中的数据同步到MaxCompute MaxCompute是适用于数据分析场景的云数据仓库，适用于大型互联网企业的数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。大数据开发治理平台 DataWorks 基于MaxCompute / EMR / MC-Hologres 等大数据计算引擎，为客户提供专业高效、安全可靠的一站式大数据开发与治理平台。本文介绍 PolarDB-X 与 MaxCompute 系统的快速对接方式，方便您对在线业务数据进行大数据分析。
【MaxCompute 常见问题】 PyODPS 1. PyODPS数据类型如何设置? 如果您使用 PyODPS，可以通过下列方法打开新数据类型开关：如果通过 execute_sql 方式打开新数据类型，可以执行 o.execute_sql( setodps.sql.type.system.odps2=true;query_sql , hints={ od ps.sql.submit.mode : script })。如果通过 Dataframe 打开新数据类型
阿里云Dataworks数据集成工具实现：OTS - Maxcompute数据同步数据集成主要用于离线(批量)数据同步。离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集，提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer)，并基于此框架设计一套简化版的中间数据传输格式，从而实现任意结构化、半结构化数据源之间数据传输。结合用户在使用OTS数据源同步的时候容易出现问题，这里演示：OTS数据源同步数据到Maxcompute的具体实现步骤。
MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

猜你喜欢

WCF技术剖析之十九：深度剖析消息编码（Encoding）实现（下篇）
采购管理系统实现建筑材料行业降本增效
Learining C++ No.12【vector】
后台获取当前客户端浏览器的类型
python网络编程——IO多路复用之epoll
8.C++-类的关键字
2021省赛 D. 路径
UCloud荣获ISO 27001和CSA STAR双重认证安全合规再下一城
Nginx安装（yum源）
pLI score
Tomcat-8.5.39性能监控及调优
Spring 框架用到的 9 个设计模式汇总！
PHP将两个二维数组合并为一个二维数组的方法
删除WP提示：自动升级WordPress失败
cocos2d-x ndk adt mac 路径配置
服务器Windows Server 2008 远程控制安全设置技巧

相关主题

mysql错误日志
PHP错误与异常
PHP屏蔽错误
php显示错误
nginx 405错误
nginx的408错误
oracle-17113错误
oracle错误汇总1
遇到的错误
错误1
npm install 错误
错误和异常
错误日志记录
MYSQL 错误日志
错误本

zl程序教程

当前栏目

MaxCompute - ODPS重装上阵　第一弹 - 善用MaxCompute编译器的错误和警告

相关文章

当前栏目

MaxCompute - ODPS重装上阵 第一弹 - 善用MaxCompute编译器的错误和警告

相关文章

MaxCompute - ODPS重装上阵　第一弹 - 善用MaxCompute编译器的错误和警告