技术分析:对比交换机堆叠技术,园区的“云化集群”是否可行?
园区网络交换机堆叠架构的历史
交换机的堆叠架构自20世纪90年代提出,其部署价值有目共睹。
比如,简化管理。堆叠后的交换机可以被视为一个逻辑实体,具有统一的管理界面,简化了管理和操作。高可用性方面,堆叠系统可以将不同物理交换机的端口进行链路聚合,使得下行链路具备更高的带宽和弹性。堆叠系统在逻辑上虚拟成一台交换机,所以也不需要为避免产生环路而去人为阻塞线路。此外,可堆叠交换机给中小企业提供了一个成本更低的选择——既有与框式设备类似的可扩展性,但又能更灵活地按需付费。
不过,随着有线、无线和物联网设备的快速增长,这种架构在下一代的园区网络中逐渐暴露出不少缺点。
一、厂商锁定。堆叠不是一个标准的协议,不同供应商的可堆叠交换机使用不同的电缆、连接器和软件,甚至同一供应商的不同交换机都不能混合使用。当堆叠中的交换机已经停止销售,但你却还需要进行扩展,那就必须整体更换。
二、有限的扩展性和带宽。虽然我们能按需增加堆叠成员,但由于堆叠带宽的限制,大多数供应商限制了堆叠组内设备的数量。(有些供应商会提供双向的吞吐量数据,可能会让客户误以为拥有两倍于实际的堆叠带宽)
三、堆叠分裂的风险。扩展或删除堆叠设备可能会导致服务中断,因为这个过程需要重新启动堆叠组下的所有设备。当故障或错误操作发生时,堆叠组可能分裂成2个或更多,导致业务受到影响。
四、软件引起严重故障。运行堆叠技术会给交换机软件增加很多复杂性(例如堆叠组管理、分裂检测等)。在现实中,堆叠组内的多台设备高度关联,一损俱损,软件问题甚至可以导致整个堆叠组的瘫痪。
五、物理拓扑结构受限。出于控制平面的时序要求和带宽的考虑,支持堆叠部署的交换机使用的是专有的电缆,这便把参与堆叠的交换机物理位置限制在了同一个机房甚至一个机柜内。
在云化园区,你甚至可以抛弃“堆叠”架构!
云计算发展的初始阶段,云计算网络架构是参照传统的园区网络来构建的。在市场需求和技术推动之下,云网络经历了20年的蜕变和升华——无论是整体网络架构还是在硬件设备、可扩展性、运维能力等方面,云网络都比传统网络更加先进。
比如基于CLOS的Spine-Leaf架构就可以保留堆叠式架构的优点,用基于L3能力来实现,总体来说可靠度更高、扩展性更强、但复杂度约等于零。
让我们参考星融元的云化园区网络架构。在这种方案下,不会有堆叠复杂的组网逻辑、纷繁的设备配置、脆弱的状态同步等机制——整个园区设备组网将如同一台具有成千上万个接入端口的超大型虚拟交换机,可以进行统一的运维管理。
- 接入终端并不需要为此方案做出任何调整,依然是通过两条(或多条)的线路、采用通用的Bond技术,上连到不同的接入Leaf;
- 接入Leaf通过使用ARP学习、32位主机路由、BGP同步等功能,利用L3网络天然的高可靠、多路径能力,达到跟传统堆叠一样的效果;
- 不涉及复杂的堆叠软件开发,因此系统的稳定性非常高,不会因为复杂的堆叠逻辑引入潜在的Bug;
- 利用L3网络的ECMP负载分担能力,可以充分利用交换机之间的所有带宽传递报文,网络性能更高。
堆叠式架构 | 云化园区网络架构 | |
---|---|---|
部署 | 1.堆叠电缆连接(或业务口连接+堆叠配置) | 1. Spine层和Leaf层之间使用通用线缆连接 |
2.增强配置(分裂检测,负载均衡模式) | 2.配置本机接口和peer信息 | |
高可用性 | 物理设备之间的链路聚合 | 全三层网络,天然避免广播风暴和以太环路;运行BGP和ECMP;使用分布式网关设计 |
物理拓扑结构 | 限制在一个房间或机柜内 | 没有物理限制 |
管理 | 堆叠组作为一台逻辑设备 | Spine-Leaf集群作为一台逻辑设备 |
软件升级 | 需要堆叠组重启,有业务中断 | 在不中断的情况下单独升级每个设备 |
扩展 | 需要根据当前堆叠的网络拓扑结构进行设计(链形加入到两端,环形需要拆环) | 按照标准CLOS架构的扩展 |
接入可扩展性以48口交换机为例 | 最大堆叠成员数为8 | [2层CLOS,48口交换机作为Spine]最大48 x 48 = 2304个接入端口 |
最大8 x 48 = 384个接入端口 | [3层CLOS,64口交换机作为3级CLOS的Spine]最大48 x 48 x 64 = 147456个接入端口 |
对比点1:同样支持多台交换机统一管理,但比堆叠架构的配置更简单
在星融元的云化园区网络架构下,运维工程师仅需完成基础的网络连接和集群相关配置,即可建立起交换机集群。集群内的多台交换机也可虚拟成一台逻辑交换机——同层设备使用同一套配置文件模板,具有统一的管理界面,配置将自动同步到集群成员(与堆叠系统类似),新增设备仅需人工完成最基础的接线操作即可通过ZTP顺利上线。
对比点2:“受限于堆叠带宽和成员数”的传统堆叠 vs “支持无限扩展”的云化集群
在Spine-Leaf架构下,集群的规模可以非常大而不必担心堆叠带宽的问题。例如,在48口接入交换机的堆叠系统中,下行端口的最大数量是48x8(因为堆叠成员限制),但在星融元的云化园区网络架构中,这个数量可以很容易地扩展到48x48(Spine层也使用48口交换机),甚至在3层CLOS架构中是48x48x64(以64口交换机作为3级CLOS的Spine为例)。
对比点3:“运行生成树协议阻塞线路” vs “网络天然无环+ECMP路由分担负载”
传统的园区网络为提高组网的可靠性并避免以太网环路和广播风暴等问题,部署了很多复杂的功能(如堆叠、MC-LAG、STP),但是这种操作往往会人为阻塞线路或者额外增加配置工作。
星融元的云化园区网络方案采用天然无环路的Spine-Leaf架构,全三层路由组网,全网链路基于ECMP多路径负载分担,在保证高链路利用率和低复杂度的前提下实现了组网的可靠性。
关键词:交换机堆叠、堆叠技术、交换机堆栈
相关文章
- 技术硬实力“我是如何理解全链路灰度的?”
- 技术分享 | TiUP工具 - TiDB集群滚动升级核心流程解析
- Node.js 应用全链路追踪技术——全链路信息存储
- 深入探索MongoDB集群测试技术(mongodb集群测试)
- Linux技术之旅:从MyBase开始(linuxmybase)
- 构建跨机房Redis集群技术之路(跨机房redis集群)
- MongoDB实现高效分页技术(mongodb高效分页)
- 技术Oracle 11g集群技术:提升企业数据库性能(oracle11g集群)
- MySQL集群与分布式技术:哪一种更适用?(mysql集群还是分布式)
- 突破性的技术——开启多线程Oracle之旅(多线程读oracle)
- Oracle实现动态分区的技术指南(oracle动态分区)
- 爬虫技术浅析
- Oracle RAC:实现高可用及负载均衡的集群技术(OracleRAC)
- 探索Linux系统中的DMA技术(linuxdma)
- 红旗Linux 8.0:新技术开启前所未有的未来(红旗linux8.0)
- MSSQL中存储过程预编译技术的实践分析(存储过程预编译mssql)
- 深入Linux网络技术:解开隐藏的内幕(linux网络技术内幕)
- Oracle中几种表分区技术简介(oracle几种表分区)
- 性Oracle冷备技术确保完备性安全(oracle 冷备 完备)
- CDH集群下的MySQL数据库技术实践(cdh mysql数据库)
- 探究MySQL在高效率下维持万级并发量的技术(mysql 万 并发量)
- 化一图解读Redis持久化技术简介(一图看懂redis持久)
- Redis集群技术探索实践篇(redis集群项目实战)
- 重构集群,Redis技术领跑(redis集群重构)
- Redis集群超卖一场信息化技术的挑战(redis集群超卖问题)
- 精确掌握Redis集群设计实现技术(redis 集群设计)
- 基于Redis集群的自动配置技术研究(redis集群自动配置)
- 实现Redis集群移动哈希槽技术变革(redis集群移动哈希槽)
- 深入理解Redis集群技术(redis集群理解)
- 分布式架构Redis集群实现无感知分布式架构技术研究(redis集群无感知)
- 使用Redis集群的Watch技术监控数据(redis集群watch)
- 使用Oracle技术,解决复杂的双序列号问题(oracle 两套序列号)
- 深入探索Redis连接池集群技术(redis连接池集群)