您现在的位置是：首页 > 后端

当前栏目

理解HDFS高可用性架构详解大数据

架构数据 HDFS 详解理解高可用性

2023-06-13 09:20:22 时间

在Hadoop1.x版本的时候，Namenode存在着单点失效的问题。如果namenode失效了，那么所有的基于HDFS的客户端——包括MapReduce作业均无法读，写或列文件，因为namenode是唯一存储元数据与文件到数据块映射的地方。而从一个失效的namenode中恢复的步骤繁多，系统恢复时间太长，也会影响到日常的维护。

Hadoop的2.x版本在HDFS中增加了对高可用性的支持来解决单点失效的问题。

这一实现中简单说就是配置了一对活动-备用namenode。当活动namenode失效的时候，备用namenode就会接管它的任务并开始服务于来自客户端的请求，不会有任何明显中断。

下面我们来看一下HDFS实现高可用性的架构图：

从架构图我们可以看到：

Active NameNode 和 Standby NameNode：两台 NameNode 形成互备，一台处于 Active 状态，为主 NameNode，另外一台处于 Standby 状态，为备 NameNode，只有主 NameNode 才能对外提供读写服务。

主备切换控制器又称故障转移控制器，ZKFailoverController：ZKFailoverController 作为独立的进程运行，对 NameNode 的主备切换进行总体控制。ZKFailoverController 能及时检测到NameNode 的健康状况，在主NameNode 故障时借助 Zookeeper 实现自动的主备选举和切换。

Zookeeper 集群：为主备切换控制器提供主备选举支持。

共享存储系统：共享存储系统是实现NameNode 的高可用最为关键的部分，共享存储系统保存了 NameNode 在运行过程中所产生的 HDFS 的元数据。主NameNode和备NameNode 通过共享存储系统实现元数据同步。在进行主备切换的时候，新的主 NameNode 在确认元数据完全同步之后才能继续对外提供服务。

DataNode 节点：除了通过共享存储系统共享 HDFS 的元数据信息之外，主 NameNode 和备 NameNode 还需要共享 HDFS 的数据块和 DataNode 之间的映射关系。DataNode 会同时向主 NameNode 和备 NameNode 上报数据块的位置信息。

原创文章，作者：Maggie-Hunter，如若转载，请注明出处：https://blog.ytso.com/7672.html

分布式文件系统，分布式数据库区块链并行处理（MPP）数据库，数据挖掘开源大数据平台数据中台数据分析数据开发数据治理数据湖数据采集

猜你喜欢

nginx日志分割forlinux
SQL Server 6.0.2: 您的信任之选（sqlserver602）
数据结构之AVL平衡二叉树
Linux 指令：深入剖析（linux指令详解）
ECCV&CVPR论文速递2022.7.5！最新成果demo展示
http状态码详解程序员
Oracle动态分区实现快速数据处理（oracle动态分区）
MySQL数据分割技巧一列内容分割（mysql 一列内容分割）
Linux如何安装RPM文件（linux安装rpm文件）
Redis负载究竟有多大（redis负载很高）
瞭望未来认识Oracle公司（oracle公司简介）
利用Oracle个人版本提升办公效率（oracle个人版本）
内容替换快速替换linux指定行内容（linux指定行）
C#中的闭包和意想不到的坑
与Oracle中遍历数据的完美探索（oracle中数据的遍历）
更新库 vs Redis怎样找准优先级（先更新库还是Redis）
直播预告｜备受瞩目的HTAP：揭秘其背后的技术挑战与解决方案
【集合论】二元关系 ( 二元关系记法 | A 到 B 的二元关系 | 二元关系个数 | 二元关系示例 )
c4d软件是干嘛的？三维建模动画c4d软件安装包下载及安装激活
MySQL 求和聚合一列数据（mysql一列相加求和）

zl程序教程

当前栏目

理解HDFS高可用性架构详解大数据

相关文章