您现在的位置是：首页 > 大数据

当前栏目

hadoop中NameNode、DataNode和Client三者之间协作关系及通信方式介绍详解大数据

hadoop 数据通信详解介绍方式之间 Client

2023-06-13 09:20:27 时间

ignore_js_op

1）NameNode、DataNode和Client
NameNode可以看作是分布式文件系统中的管理者，主要负责管理文件系统的命名空间、集群配置信息和存储块的复制等。NameNode会将文件系统的Meta-data存储在内存中，这些信息主要包括了文件信息、每一个文件对应的文件块的信息和每一个文件块在DataNode的信息等。
DataNode是文件存储的基本单元，它将Block存储在本地文件系统中，保存了Block的Meta-data，同时周期性地将所有存在的Block信息发送给NameNode。
Client就是需要获取分布式文件系统文件的应用程序。

2）文件写入
Client向NameNode发起文件写入的请求。
NameNode根据文件大小和文件块配置情况，返回给Client它所管理部分DataNode的信息。
Client将文件划分为多个Block，根据DataNode的地址信息，按顺序写入到每一个DataNode块中。

3）文件读取
Client向NameNode发起文件读取的请求。
NameNode返回文件存储的DataNode的信息。
Client读取文件信息。

通信方式介绍：

在hadoop系统中，master/slaves/client的对应关系是：
master namenode；
slaves datanode；
client dfsclient；
那究竟是通过什么样的方式进行通信的呢，在这里从大体介绍一下：
简单地讲：
client和namenode之间是通过rpc通信；
datanode和namenode之间是通过rpc通信；
client和datanode之间是通过简单的socket通信。
随便拔一下DFSClient的代码，可以看到它有一个成员变量public final ClientProtocolnamenode;
而再拔一下DataNode的代码，可以看到它也有一个成员变量public DatanodeProtocolnamenode

文章转自：http://www.aboutyun.com/thread-6794-1-1.html

原创文章，作者：Maggie-Hunter，如若转载，请注明出处：https://blog.ytso.com/9576.html

分布式文件系统，分布式数据库区块链并行处理（MPP）数据库，数据挖掘开源大数据平台数据中台数据分析数据开发数据治理数据湖数据采集

猜你喜欢

NVM Windows Portable Installation
的Linux下使用CD命令的技巧（Cd怎么用linux）
Redis远程连接的实现机制（redis远程连接原理）
js调用flash的效果代码
崩溃恢复昨日MySQL数据崩溃灾难（mysql昨天的数据）
spring boot 启动的时候required a bean of type 'XXX' that could not be
Oracle以几个字节的力量改变世界（oracle 几个字节）
RedHat 更新CentOS Yum源详解程序员
借助 HTTP 通过 SSH 绕过 Linux 防火墙
读研转码，纠结技术方向
掌握Linux终端，拥抱技术新风尚（linux终端标题）
《科学》：媲美AlphaFold2的蛋白质结构预测新工具问世，一台游戏计算机十分钟出结果，完全免费
两个php日期控制类实例
Oracle临时表的使用场景及锁机制分析（oracle临时表TO锁）
技嘉发布迷你主机Brix
怎样实现 T+0 的实时报表？
「轻松学 Linux 网络配置，让你的网络更强大！」（linux网络配置教程）
Mongodb快速新建表，更高效管理数据（mongodb新建表）
优化优化MySQL最大并发连接的方法（mysql最大并发连接）

zl程序教程

当前栏目

hadoop中NameNode、DataNode和Client三者之间协作关系及通信方式介绍详解大数据

相关文章