计算节点宕机了怎么办?- 每天5分钟玩转 OpenStack(43)
Rebuild 可以恢复损坏的 instance。
那如果是宿主机坏了怎么办呢? 比如硬件故障或者断电造成整台计算节点无法工作,该节点上运行的 instance 如何恢复呢?
用 Shelve 或者 Migrate 可不可以? 很不幸,这两个操作都要求 instance 所在计算节点的 nova-compute 服务正常运行。 幸运的是,还有 Evacuate 操作。
Evacuate 可在 nova-compute 无法工作的情况下将节点上的 instance 迁移到其他计算节点上。但有个前提: Instance 的镜像文件必须放在共享存储上。
下面是 Evacuate instance 的流程图
下面我们详细讨论每一个步骤。
向 nova-api 发送请求我们的实验场景如下: Instance c2 运行在 devstack-compute1 上。
通过断电模拟计算节点故障,然后执行 Evacuate 操作恢复 instance c2。 目前 Evacuate 只能通过 CLI 执行。
这里需要指定 on-shared-storage 这个参数
查看日志 /opt/stack/logs/n-api.log
nova-api 向 Messaging(RabbitMQ)发送了一条消息:“Evacuate 这个 Instance” 查看源代码 /opt/stack/nova/nova/compute/api.py,方法是 evacuate。
大家注意到没有,evacuate 实际上是通过 rebuild 操作实现的。 这是可以理解的,因为 evacuate 是用共享存储上 instance 的镜像文件重新创建虚机
nova-scheduler 执行调度nova-scheduler 收到消息后,会为 instance 选择合适的计算节点。 查看日志 /opt/stack/logs/n-sch.log。
nova-scheduler 最后选择在 devstack-controller 计算节点上重建 instance。
nova-scheduler 发送消息nova-scheduler 发送消息,通知计算节点可以创建 instance 了。 源代码在 /opt/stack/nova/nova/scheduler/filter_scheduler.py 第 95 行,方法为 select_destinations。
计算节点上的工作是用共享存储上的镜像文件重建 instance。 日志在 devstack-controller:/opt/stack/logs/n-cpu.log。
为instance分配资源
使用共享存储上的镜像文件
启动 instance
Evacuate 操作完成后,instance 在 devstack-controller 上运行。
以上是 Evacuate 操作的详细分析。
至此,我们已经学习完 Nova 所有的操作,下一节将用一张图总结这些操作的用途和使用场景。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/54638.html
相关文章
- XSLT函数集合:数值函数、字符串函、节点集函数和布尔函数
- 二叉树计算叶子节点的计算问题
- 云计算运维一步步编译安装Kubernetes之计算节点安装部署
- 云计算运维一步步编译安装Kubernetes之master计算节点安装
- kubernetes环境部署单节点redis数据库的方法
- [javaSE] 数据结构(二叉查找树-插入节点)详解编程语言
- 链表中的入口节点详解编程语言
- 利用Oracle递归查找子节点的简捷方法(oracle递归查询子节点)
- 使用Redis添加分布式节点(redis添加节点)
- Oracle查询子节点轻松实现,数据分析从容出击!(oracle查询子节点)
- Redis主从节点实现高可用架构,提升数据处理效率(redis主从节点)
- Oracle节点创新技术驱动实现现代应用(nodes oracle)
- 提升Redis集群性能的三大步骤(如何增加redis的节点)
- 可视化深入浅出Redis集群节点信息可视化(redis集群节点信息)
- 崩溃恢复Redis集群从节点崩溃到恢复(redis 集群 从节点)
- 研究Redis节点的功能和用途(redis节点有什么用)
- Jquery节点遍历next与nextAll方法使用示例