您现在的位置是：首页 > .Net

当前栏目

pod(四)：pod的重启策略和生命周期

2023-02-18 16:34:30 时间

一.系统环境
二.前言
三.pod的重启策略
四.pod的生命周期

一.系统环境

服务器版本	docker软件版本	Kubernetes(k8s)集群版本	CPU架构
CentOS Linux release 7.4.1708 (Core)	Docker version 20.10.12	v1.21.9	x86_64

Kubernetes集群架构：k8scloude1作为master节点，k8scloude2，k8scloude3作为worker节点

服务器	操作系统版本	CPU架构	进程	功能描述
k8scloude1/192.168.110.130	CentOS Linux release 7.4.1708 (Core)	x86_64	docker，kube-apiserver，etcd，kube-scheduler，kube-controller-manager，kubelet，kube-proxy，coredns，calico	k8s master节点
k8scloude2/192.168.110.129	CentOS Linux release 7.4.1708 (Core)	x86_64	docker，kubelet，kube-proxy，calico	k8s worker节点
k8scloude3/192.168.110.128	CentOS Linux release 7.4.1708 (Core)	x86_64	docker，kubelet，kube-proxy，calico	k8s worker节点

二.前言

本文介绍pod的3个重启策略（Always、OnFailure 和 Never）和5个pod的状态（Pending，Running，Succeeded，Failed，Unknown）。

管理pod的前提是已经有一套可以正常运行的Kubernetes集群，关于Kubernetes(k8s)集群的安装部署，可以查看博客《Centos7 安装部署Kubernetes(k8s)集群》https://www.cnblogs.com/renshengdezheli/p/16686769.html

三.pod的重启策略

容器的重启策略：Pod 的 spec 中包含一个 restartPolicy 字段，其可能取值包括 Always、OnFailure 和 Never。默认值是 Always。restartPolicy 适用于 Pod 中的所有容器。restartPolicy 仅针对同一节点上 kubelet 的容器重启动作。当 Pod 中的容器退出时，kubelet 会按指数回退方式计算重启的延迟（10s、20s、40s、...），其最长延迟为 5 分钟。一旦某容器执行了 10 分钟并且没有出现问题，kubelet 对该容器的重启回退计时器执行重置操作。

restartPolicy字段表示pod的重启策略：pod里的容器的重启策略有Always, OnFailure,Never 。

Always：总是重启；
OnFailure：故障了就重启，sleep 10只是正常到期不是故障，所以不会重启；
Never：从不重启。

获取restartPolicy字段的解释说明：

[root@k8scloude1 pod]# kubectl explain pods.spec.restartPolicy
KIND:     Pod
VERSION:  v1

FIELD:    restartPolicy <string>

DESCRIPTION:
     Restart policy for all containers within the pod. One of Always, OnFailure,
     Never. Default to Always. More info:
     https://kubernetes.io/docs/concepts/workloads/pods/pod-lifecycle/#restart-policy

四.pod的生命周期

Pod 遵循一个预定义的生命周期，起始于 Pending 阶段，如果至少其中有一个主要容器正常启动，则进入 Running，之后取决于 Pod 中是否有容器以失败状态结束而进入 Succeeded 或者 Failed 阶段。

在 Pod 运行期间，kubelet 能够重启容器以处理一些失效场景。在 Pod 内部，Kubernetes 跟踪不同容器的状态并确定使 Pod 重新变得健康所需要采取的动作。

在 Kubernetes API 中，Pod 包含规约部分和实际状态部分。 Pod 对象的状态包含了一组 Pod 状况（Conditions）。如果应用需要的话，你也可以向其中注入自定义的就绪性信息。

Pod 在其生命周期中只会被调度一次。一旦 Pod 被调度（分派）到某个节点，Pod 会一直在该节点运行，直到 Pod 停止或者被终止。

Pod 阶段：Pod 的 status 字段是一个 PodStatus 对象，其中包含一个 phase 字段。Pod 的阶段（Phase）是 Pod 在其生命周期中所处位置的简单宏观概述。该阶段并不是对容器或 Pod 状态的综合汇总，也不是为了成为完整的状态机。

Pod 阶段的数量和含义是严格定义的。下面是 phase 可能的值：

取值	描述
Pending	Pod 已被 Kubernetes 系统接受，但有一个或者多个容器尚未创建亦未运行。此阶段包括等待 Pod 被调度的时间和通过网络下载镜像的时间。
Running	Pod 已经绑定到了某个节点，Pod 中所有的容器都已被创建。至少有一个容器仍在运行，或者正处于启动或重启状态。
Succeeded	Pod 中的所有容器都已成功终止，并且不会再重启。
Failed	Pod 中的所有容器都已终止，并且至少有一个容器是因为失败终止。也就是说，容器以非 0 状态退出或者被系统终止。
Unknown	因为某些原因无法取得 Pod 的状态。这种情况通常是因为与 Pod 所在主机通信失败。

如果某节点死掉或者与集群中其他节点失联，Kubernetes 会实施一种策略，将失去的节点上运行的所有 Pod 的 phase 设置为 Failed。

一般情况下，删除pod很慢，要等30秒才能删除pod

[root@k8scloude1 pod]# kubectl get pod
NAME    READY   STATUS             RESTARTS   AGE
nginx   1/1     Running            0          45m
pod1    1/2     CrashLoopBackOff   11         34m

#kubectl delete pod pod1 :删除很慢，要等30秒才能删除
[root@k8scloude1 pod]# kubectl delete pod pod1
pod "pod1" deleted

查看宽限时间，terminationGracePeriodSeconds：表示优雅的终止pod需要多长时间，默认是30s

[root@k8scloude1 ~]# kubectl explain pods.spec.terminationGracePeriodSeconds
KIND:     Pod
VERSION:  v1

FIELD:    terminationGracePeriodSeconds <integer>

DESCRIPTION:
     Optional duration in seconds the pod needs to terminate gracefully. May be
     decreased in delete request. Value must be non-negative integer. The value
     zero indicates stop immediately via the kill signal (no opportunity to shut
     down). If this value is nil, the default grace period will be used instead.
     The grace period is the duration in seconds after the processes running in
     the pod are sent a termination signal and the time when the processes are
     forcibly halted with a kill signal. Set this value longer than the expected
     cleanup time for your process. Defaults to 30 seconds.

修改terminationGracePeriodSeconds参数为0，可以立马删除pod

[root@k8scloude1 pod]# vim pod2.yaml 

#把terminationGracePeriodSeconds设置为0
[root@k8scloude1 pod]# cat pod2.yaml 
apiVersion: v1
kind: Pod
metadata:
  creationTimestamp: null
  labels:
    run: pod1
  name: pod1
spec:
  terminationGracePeriodSeconds: 0
  containers:
  - image: nginx
    imagePullPolicy: IfNotPresent
    name: n1
    resources: {}
  - image: nginx
    imagePullPolicy: IfNotPresent
    command: ["sh","-c","sleep 10"]
    name: n2
    resources: {}
  dnsPolicy: ClusterFirst
  restartPolicy: Always
status: {}

[root@k8scloude1 pod]# kubectl apply -f pod2.yaml 
pod/pod1 created
[root@k8scloude1 pod]# kubectl get pod
NAME    READY   STATUS    RESTARTS   AGE
nginx   1/1     Running   0          56m
pod1    2/2     Running   1          18s

#terminationGracePeriodSeconds: 0  参数为0之后，立马就删除pod了
[root@k8scloude1 pod]# kubectl delete pod pod1 
pod "pod1" deleted

猜你喜欢

[GO项目]开源免费在线客服系统-真正免费开源-GOFLY0.3.5发布-极简强大Go语言开发WEB网页客服
[javascript]使用正则替换url中最后面的斜杠
[Go] go等待读取最后一行的数据内容
[Go] Golang中的面向对象
[Linux] 常见的并发模型
[MySQL]简单理解并发下的CAS比较交换和ABA问题
[前端]使用meta控制双核浏览器默认使用webkit/chrome内核
[Go]Golang中控制并发的sync包
[PHP] pmap可以查看进程占用内存的详细情况
[PHP] 解决php中上传大文件的错误
[日常]GB2312 GBK GB18030的区别和演进过程
[PHP] 循环查看php-fpm的内存占用情况
[GO项目]开源免费在线客服系统-真正免费开源-GOFLY0.3.3发布-极简强大Go语言开发网页客服
[日常]中文字符串比较大小的方式
[日常]win10解除网速限制
[Go] go中的goto语句跳到指定标签
[日常]解决win10没有组策略问题
[MySQL] mysql中bitmap的简单运用
[MySQL]开启慢查询日志以及未使用索引SQL日志
[MySQL]explain语句中type字段的具体解释

zl程序教程