您现在的位置是：首页 > 大数据

当前栏目

RRegionServer Splitting 实现过程详解大数据

数据实现详解过程

2023-06-13 09:20:27 时间

RRegionServer Splitting 实现过程

1、RegionServer决定本地的region分裂，并准备分裂工作。第一步是，在zookeeper的/hbase/region-in-reansition/region-name下创建一个znode，并设为SPLITTING状态。

2、Master通过父region-in-transition znode的watcher监测到刚刚创建的znode。

3、RegionServer在HDFS中父region的目录下创建名为“.split”的子目录。

4、RegionServer关闭父region，并强制刷新缓存内的数据，之后在本地数据结构中将标识为下线状态。此时来自Client的对父region的请求会抛出NotServingRegionException ，Client将重新尝试向其他的region发送请求。

5、RegionServer在.split目录下为子regionA和B创建目录和相关的数据结构。然后RegionServer分割store文件，这种分割是指，为父region的每个store文件创建两个Reference文件。这些Reference文件将指向父region中的文件。

6、RegionServer在HDFS中创建实际的region目录，并移动每个子region的Reference文件。

7、RegionServer向.META.表发送Put请求，并在.META.中将父region改为下线状态，添加子region的信息。此时表中并单独存储没有子region信息的条目。Client扫描.META.时回看到父region为分裂状态，但直到子region信息出现在表中，Client才直到他们的存在。如果Put请求成功，那么父region将被有效地分割。如果在这条RPC成功之前RegionServer死掉了，那么Master和打开region的下一个RegionServer会清理关于该region分裂的脏状态。在.META.更新之后，region的分裂将被Master回滚到之前的状态。

8、RegionServer打开子region，并行地接受写请求。

9、RegionServer将子region A和B的相关信息写入.META.。此后，Client便可以扫描到新的region，并且可以向其发送请求。Client会在本地缓存.META.的条目，但当她们向RegionServer或.META.发送请求时，这些缓存便无效了，他们竟重新学习.META.中新region的信息。

10、RegionServer将zookeeper中的znode /hbase/region-in-transition/region-name更改为SPLIT状态，以便Master可以监测到。如果子Region被选中了，Balancer可以自由地将子region分派到其他RegionServer上。

11、分裂之后，元数据和HDFS中依然包含着指向父region的Reference文件。这些Reference文件将在子region发生紧缩操作重写数据文件时被删除掉。Master的垃圾回收工会周期性地检测是否还有指向父region的Reference，如果没有，将删除父region。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/9565.html

分布式文件系统，分布式数据库区块链并行处理（MPP）数据库，数据挖掘开源大数据平台数据中台数据分析数据开发数据治理数据湖数据采集

猜你喜欢

mysql日期格式化 yyyymmdd_mysql中时间日期格式化
英语二-解决问题类短文写作
Oracle IAS 尽享先进技术带来的管理之福（oracle ias简介）
穷小子击败世袭财阀？这位韩国新首富有点东西
Android学习笔记（一）环境安装及第一个helloworld
数据库Linux下一步步安装Oracle数据库（linux安装orcle）
MySQL数据库复制教程（mysql数据库如何拷贝）
经颅直流电刺激对大脑网络的调制
.htaccess使用方法总结
部署Oracle RAC私网不可忽视的安全之道（oracle rac私网）
天猫双11订单峰值58.3万笔/秒，消费狂欢背后隐藏了哪些技术？
加速几十倍 git clone 速度的 --depth 1，它的后遗症怎么解决？
Nexus学习笔记–Nexus3使用教程
node.js中的fs.writeSync方法使用说明
currentStyle使用示例[通俗易懂]
Oracle只用了一分钟就完成减法（oracle 减去一分钟）
WordPress 技巧：重置 WordPress 所有的用户角色和权限

zl程序教程

当前栏目

RRegionServer Splitting 实现过程详解大数据

相关文章