MapReduce与Hadoop之比较
hadoop 比较 MapReduce
2023-09-14 09:12:00 时间
MapReduce与Hadoop之比较
Hadoop是Apache软件基金会发起的一个项目,在大数据分析以及非结构化数据蔓延的背景下,Hadoop受到了前所未有的关注。
Hadoop是一种分布式数据和计算的框架。它很擅长存储大量的半结构化的数据集。数据可以随机存放,所以一个磁盘的失败并不会带来数据丢失。Hadoop也非常擅长分布式计算——快速地跨多台机器处理大型数据集合。
MapReduce是处理大量半结构化数据集合的编程模型。编程模型是一种处理并结构化特定问题的方式。例如,在一个关系数据库中,使用一种集合语言执行查询,如SQL。告诉语言想要的结果,并将它提交给系统来计算出如何产生计算。还可以用更传统的语言(C++,Java),一步步地来解决问题。这是两种不同的编程模型,MapReduce就是另外一种。
MapReduce和Hadoop是相互独立的,实际上又能相互配合工作得很好。
相关文章
- 试述Hadoop的HDFS及其组成_hadoop命令和hdfs命令区别
- hadoop生态圈详解
- Hadoop安装与配置详细教程「建议收藏」
- Spark和Hadoop的区别和比较[通俗易懂]
- 关于Hadoop集群物理及虚拟内存的检测的设置说明
- Porn Data Anaylize — Hadoop安装
- hadoop自带的writable类型详解大数据
- Maven引入Hadoop依赖报错:Missing artifact jdk.tools:jdk.tools:jar:1.6详解大数据
- 运行Linux下Hadoop强劲运行:实现数据分析的奇迹(linux下hadoop)
- Hadoop——高可用(High Available,HA)模式与联邦机制(Federation)启蒙详解编程语言
- Linux下快速启动Hadoop集群(linux启动hadoop)
- Hadoop入门扫盲:hadoop发行版介绍与选择