您现在的位置是：首页 > 其他

当前栏目

Ceph分布式存储实战3.1　引言

算法存储系统数据分布式分布式

2023-03-09 22:17:45 时间

智能分布CRUSH

3.1　引言

数据分布是分布式存储系统的一个重要部分，数据分布算法至少要考虑以下3个因素。

1）故障域隔离。同份数据的不同副本分布在不同的故障域，降低数据损坏的风险。

2）负载均衡。数据能够均匀地分布在磁盘容量不等的存储节点，避免部分节点空闲，部分节点超载，从而影响系统性能。

3）控制节点加入离开时引起的数据迁移量。当节点离开时，最优的数据迁移是只有离线节点上的数据被迁移到其他节点，而正常工作的节点的数据不会发生迁移。

对象存储中一致性Hash和Ceph的CRUSH算法是使用比较多的数据分布算法。在Aamzon的Dyanmo键值存储系统中采用一致性Hash算法，并且对它做了很多优化。OpenStack的Swift对象存储系统也使用了一致性Hash算法。

CRUSH（Controlled Replication Under Scalable Hashing）是一种基于伪随机控制数据分布、复制的算法。Ceph是为大规模分布式存储系统（PB级的数据和成百上千台存储设备）而设计的，在大规模的存储系统里，必须考虑数据的平衡分布和负载（提高资源利用率）、最大化系统的性能，以及系统的扩展和硬件容错等。CRUSH就是为解决以上问题而设计的。在Ceph集群里，CRUSH只需要一个简洁而层次清晰的设备描述，包括存储集群和副本放置策略，就可以有效地把数据对象映射到存储设备上，且这个过程是完全分布式的，在集群系统中的任何一方都可以独立计算任何对象的位置；另外，大型系统存储结构是动态变化的（存储节点的扩展或者缩容、硬件故障等），CRUSH能够处理存储设备的变更（添加或删除），并最小化由于存储设备的变更而导致的数据迁移。

猜你喜欢

Intellij IDEA 常用插件
GRPC: 如何设计 RPC 错误码？
MySQL忘记密码的处理方法（MySQL重置密码）
Redis的缓存穿透、缓存击穿和缓存雪崩定义、原因及其解决方案
高校学生参加飞天加速计划
高校学生在家实践续费文章
为什么行业云是云计算转型的未来
ECS使用感
在启用.co域名几个月后，我们还是选择升级为.com域名
关闭IPV6
新版ICANN管理的根服务器 (IMRS)活动和事件报告页面
Linux挂载硬盘
Java应用构建并部署ECS
《中国好声音2021》5强诞生，你pick的人气学员.fans域名抢了没？
阿里云服务器学习体验
数字油画艺术家瑟瓦作品展示站
因缺少绝对路径引发的部署血案
RISC-V MCU开发 (四)：编译配置
阿里云体验
代币域名nftchain.com以57万元领跑Sedo榜！

zl程序教程

当前栏目

Ceph分布式存储实战3.1　引言

相关文章

当前栏目

Ceph分布式存储实战3.1 引言

相关文章

Ceph分布式存储实战3.1　引言