您现在的位置是：首页 > 数据库

当前栏目

大数据技术的对决——Spark对Impala对Hive对Presto

技术性能数据 Spark

2023-03-14 10:15:41 时间

在大数据浪潮全面来袭的历史背景下，我们一直面临着同一类难题的困扰——该选择哪款工具解决相关问题?这项挑战在大数据SQL引擎领域同样存在。作为大数据报告工具开发商，AtScale公司通过基准测试为我们带来了如下答案：

1. Spark 2.0在大规模查询性能方面可达1.6版本的2.4倍。二者的小规模查询性能基本持平。

Spark 2.0 improved its large query performance by an average of 2.4X over Spark 1.6 (so upgrade!). Small query performance was already good and remained roughly the same.

2. Impala 2.6版本在大规模查询性能可达2.3版本的2.8倍，小规模查询基本持平。

Impala 2.6 is 2.8X as fast for large queries as version 2.3. Small query performance was already good and remained roughly the same.

3. Hive 2.1配合LLAP在大规模查询场景下可实现1.2版本性能的3.4倍，小规模查询性能则为2倍。

Hive 2.1 with LLAP is over 3.4X faster than 1.2, and its small query performance doubled. If you're using Hive, this isn't an upgrade you can afford to skip.

猜你喜欢

优思学院｜六西格玛团队缺乏方向感怎么办？根本原因是...
2021双11云服务器优惠对比
西部数码虚拟主机怎么查ip
ONLYOFFICE 文档 v7.3 现已发布：新增字段填写接收人角色、SmartArt、全新安全性设置、查看窗口等功能
这几个 GitHub 开源项目真带劲
看！一文Get阿里云基础设施2021云栖精彩时刻
CATIA等设计类软件实时渲染流化解决方案
RedisAssistant：一款Redis可视化管理工具
首个千亿模型压缩算法 SparseGPT 来了，降低算力成本的同时保持高精度
“后红海”时代，大数据体系到底是什么？-上篇
「解决方案架构」解决方案架构生命周期
Facebook改名为Meta，启用域名meta.com!
ICLR 2022 | DBD: 基于分割后门训练过程的后门防御方法
风靡27年，这本经典巨著YYDS！
云上学习实践
ECS服务器linux初体验
apisix control api的使用
西部数码2021双11大促：云服务器1折秒杀
西部数码双11促销：2核2G云服务器仅需222元！
基于 MaxCompute 的实时数据处理实践

zl程序教程

当前栏目

大数据技术的对决——Spark对Impala对Hive对Presto

相关文章