zl程序教程

您现在的位置是:首页 >  其他

当前栏目

K8S集群中Node节点资源不足导致Pod无法运行的故障排查思路

2023-04-18 16:58:45 时间

K8S集群中Node节点资源不足导致Pod无法运行的故障排查思路

1.Node节点资源不足可能会产生的故障

故障一:Pod数量太多超出物理节点的限制

每一台Node节点中默认限制最多运行110个Pod资源,当一个应用程序有成百上千的Pod资源时,如果不扩容Node节点或者修改最大Pod数量限制,那么就会导致部分Pod资源无法正常运行,因为节点已经没有资源可以被调度了。

解决思路就是扩容Node节点数量或者修改Pod的数量限制。

故障二:Pod配置的资源限额超出物理节点的最大使用率

由于Node节点资源有限,当Pod设置的资源配额超出了Node节点所承受的极限,那么Pod将无法部署和运行,会报错没有合适的Node节点可调度。

解决思路就是对资源限方面重新调整,适当扩展节点资源。

2.Node节点资源不足故障排查案例一

故障描述:

Pod资源数量过多,超出节点调度Pod的数量。