在K8S中,节点故障pod驱逐pod过程,时间怎么定义的?

本文涉及的产品
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: 在K8S中,节点故障pod驱逐pod过程,时间怎么定义的?

在Kubernetes(K8S)中,节点故障导致Pod驱逐的过程是一个涉及多个组件和参数协同工作的复杂流程。这个过程的时间定义主要通过一系列参数来配置和确定。以下是该过程的详细解释以及时间定义的说明:

一、节点故障检测
  1. 节点控制器(Node Controller)检查间隔:
  • node-monitor-period:这是节点控制器检查每个节点健康状态的间隔时间。默认值为5秒。即每5秒,节点控制器会尝试与集群中的每个节点进行通信,以确认其状态。
  1. 节点故障判断时间窗口:
  • node-monitor-grace-period:这是节点控制器在判断节点为故障之前等待的时间窗口。默认值为40秒。如果在40秒内节点控制器没有收到节点的响应或确认消息,则节点控制器会将该节点标记为“NotReady”状态。
二、Pod驱逐过程
  1. Pod保留时间:
  • pod-eviction-timeout:当节点被标记为故障后,kubelet允许Pod在此故障节点上保留的时间。默认值为300秒(即5分钟)。这意味着,从节点被标记为故障开始,kubelet会等待5分钟,然后再开始驱逐该节点上的Pod。
  1. 驱逐过程:
  • 一旦超过pod-eviction-timeout设置的时间,kubelet会开始将故障节点上的Pod驱逐到其他健康的节点上。这个过程包括终止Pod中的容器、清理相关资源等。
三、时间定义总结
  • 总时间:从节点故障开始到Pod被完全驱逐到其他节点,整个过程的时间大致为node-monitor-grace-period + pod-eviction-timeout,即40秒 + 300秒 = 340秒(约5分40秒)。但需要注意的是,这个时间是从节点被标记为故障状态开始计算的,而节点被标记为故障状态之前还有node-monitor-period的等待时间(5秒)。
  • 调整参数:在实际操作中,这些参数(如node-monitor-period、node-monitor-grace-period和pod-eviction-timeout)可以根据需要进行调整,以优化集群的故障恢复能力和资源利用率。
四、注意事项
  • Pod状态变化:在驱逐过程中,Pod的状态不会立即改变。在pod-eviction-timeout时间内,原本是Running的Pod状态将保持不变。当超过这个时间后,这些Pod的状态会变为Nodelost(对于DaemonSet)或Unknown(对于Deployment)。
  • 优雅终止:在驱逐Pod之前,Kubernetes会尝试优雅地终止Pod中的容器,以确保应用程序有足够的时间完成正在进行的任务并释放资源。这通过发送SIGTERM信号给容器中的进程来实现,并等待一段配置的时间(terminationGracePeriodSeconds)让进程自行终止。

综上所述,我们可以清楚地了解到Kubernetes中节点故障导致Pod驱逐的过程及其时间定义。这些参数和流程确保了集群在节点故障时能够迅速恢复服务,并保持高可用性。

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
25天前
|
JSON Kubernetes Shell
【Azure K8S | AKS】在不丢失文件/不影响POD运行的情况下增加PVC的大小
【Azure K8S | AKS】在不丢失文件/不影响POD运行的情况下增加PVC的大小
|
25天前
|
Kubernetes Shell Perl
【Azure K8S|AKS】进入AKS的POD中查看文件,例如PVC Volume Mounts使用情况
【Azure K8S|AKS】进入AKS的POD中查看文件,例如PVC Volume Mounts使用情况
|
22天前
|
存储 Kubernetes Docker
Kubernetes节点资源耗尽状态的处理
Kubernetes节点资源耗尽状态的处理
|
27天前
|
Kubernetes Docker Perl
在K8S中,如果是因为开发写的镜像问题导致pod起不来该怎么排查?
在K8S中,如果是因为开发写的镜像问题导致pod起不来该怎么排查?
|
22天前
|
Kubernetes Unix Linux
k8s将节点容器运行时从Docker迁移到Containerd
k8s将节点容器运行时从Docker迁移到Containerd
|
16天前
|
存储 Kubernetes 负载均衡
CentOS 7.9二进制部署K8S 1.28.3+集群实战
本文详细介绍了在CentOS 7.9上通过二进制方式部署Kubernetes 1.28.3+集群的全过程,包括环境准备、组件安装、证书生成、高可用配置以及网络插件部署等关键步骤。
101 3
CentOS 7.9二进制部署K8S 1.28.3+集群实战
|
16天前
|
Kubernetes 负载均衡 前端开发
二进制部署Kubernetes 1.23.15版本高可用集群实战
使用二进制文件部署Kubernetes 1.23.15版本高可用集群的详细教程,涵盖了从环境准备到网络插件部署的完整流程。
33 2
二进制部署Kubernetes 1.23.15版本高可用集群实战
|
16天前
|
存储 Kubernetes 测试技术
k8s使用pvc,pv,sc关联ceph集群
文章介绍了如何在Kubernetes中使用PersistentVolumeClaim (PVC)、PersistentVolume (PV) 和StorageClass (SC) 来关联Ceph集群,包括创建Ceph镜像、配置访问密钥、删除默认存储类、编写和应用资源清单、创建资源以及进行访问测试的步骤。同时,还提供了如何使用RBD动态存储类来关联Ceph集群的指南。
33 7
|
16天前
|
存储 Kubernetes 数据安全/隐私保护
k8s对接ceph集群的分布式文件系统CephFS
文章介绍了如何在Kubernetes集群中使用CephFS作为持久化存储,包括通过secretFile和secretRef两种方式进行认证和配置。
25 5
|
16天前
|
Kubernetes 负载均衡 应用服务中间件
kubeadm快速构建K8S1.28.1高可用集群
关于如何使用kubeadm快速构建Kubernetes 1.28.1高可用集群的详细教程。
35 2