您现在的位置是：首页 > 数据库

当前栏目

5个大数据处理/数据分析/分布式工具

计算工具集群系统数据数据分析分布式分布式

2023-03-09 21:57:43 时间

1.Hadoop

Hadoop是一个开源框架，它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。它的目的是从单一的服务器到上千台机器的扩展，每一个台机都可以提供本地计算和存储。

5个大数据处理/数据分析/分布式工具

2.Druid

Druid是实时数据分析存储系统，Java语言中***的数据库连接池。Druid能够提供强大的监控和扩展功能。

Druid是一个分布式的、面向列的、实时的分析数据存储库，通常用于为多租户环境中的探索性仪表板供电。

Druid作为一种数据仓库解决方案，擅长于对petabyte大小的数据集进行快速聚合查询。Druid支持各种灵活的过滤器、精确计算、近似算法和其他有用的计算。

Druid可以同时加载流数据和批处理数据，并与Samza、Kafka、Storm、SPark和Hadoop集成。

5个大数据处理/数据分析/分布式工具

3.Ambari

大数据平台搭建、监控利器；类似的还有CDH

Ambari能够：

提供Hadoop集群

Ambari为在任意数量的主机上安装Hadoop服务提供了一个逐步向导。
Ambari处理集群Hadoop服务的配置。

管理Hadoop集群

Ambari为整个集群提供启动、停止和重新配置Hadoop服务的中央管理。

监视Hadoop集群

Ambari为监视Hadoop集群的健康状况和状态提供了一个仪表板。
安巴里杠杆Ambari度量系统用于度量集合。
安巴里杠杆Ambari警报框架用于系统警报，并在需要注意时通知您(例如，节点下降，剩余磁盘空间较低等)。

5个大数据处理/数据分析/分布式工具

4.Spark

一个快速通用的集群计算系统.它在Java、Scala、Python和R中提供了高级API，并提供了支持通用执行图的优化引擎。大规模数据处理框架（可以应付企业中常见的三种数据处理场景：复杂的批量数据处理（batch data processing）；基于历史数据的交互式查询；基于实时数据流的数据处理，Ceph:Linux分布式文件系统。

5个大数据处理/数据分析/分布式工具

5.Storm

Storm是一个免费开源、分布式、高容错的实时计算系统。Storm令持续不断的流计算变得容易，弥补了Hadoop批处理所不能满足的实时要求。Storm经常用于在实时分析、在线机器学习、持续计算、分布式远程调用和ETL等领域。Storm的部署管理非常简单，而且，在同类的流式计算工具，Storm的性能也是非常出众的。

5个大数据处理/数据分析/分布式工具

猜你喜欢

云服务器1核2g能干吗
HarmonyOS自定义JS组件—代码情诗
云服务器1核可以用吗
OpenHarmony自定义全屏系统桌面
OpenHarmony预置系统应用编译安装全流程记录
云服务器1核1g1m能干什么
十一个步骤完美排查服务器是否被入侵
云服务器1核2g能干什么
如何让 LibreOffice 看起来像 Microsoft Office
云服务器1核2g什么意思
这些新功能让Windows 11文件管理器更好用了
硬核图解网络IO模型！
云服务器1核2g是什么意思
需要2个TPM认证？消息称微软下月将正式开发Windows 12系统
云服务器1核1g什么意思
性能提升4倍：内存占用率暴降！Windows 11大改进不杀进程
云服务器1核够用吗
微软 Windows 11 新版文件资源管理器上手体验：文件夹预览、快速访问固定、整合 OneDrive 网盘
.info域名多少钱一个
微软 Windows 11 Mica 云母视觉效果更强，传统应用标题栏风格大变

zl程序教程

当前栏目

5个大数据处理/数据分析/分布式工具

相关文章