有状态容器业务基于ACK多可用区部署实践

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 业务背景和要求为了让有状态应用在k8s中部署可以获得尽可能高的可用性,对业务多可用区的部署带来了更高的要求::为了更高的可用性,需要让业务pod尽量均衡的分布在多个可用区中业务pod要可以分别在不同的可用区中挂载上云盘做持久化,需要保障pod和disk始终在一个AZ(云盘不可以跨区挂载)如果一个pod或一个节点发生故障,需要第一时间将pod重新调度到同可用区的另一台可用机器上去,机器可以是弹性新建

业务背景和要求

为了让有状态应用在k8s中部署可以获得尽可能高的可用性,对业务多可用区的部署带来了更高的要求::

  1. 为了更高的可用性,需要让业务pod尽量均衡的分布在多个可用区中
  2. 业务pod要可以分别在不同的可用区中挂载上云盘做持久化,需要保障pod和disk始终在一个AZ(云盘不可以跨区挂载)
  3. 如果一个pod或一个节点发生故障,需要第一时间将pod重新调度到同可用区的另一台可用机器上去,机器可以是弹性新建的,但为了故障能最快速的自愈,该机器最好是预热在节点池中的,pod可以第一时间调度到同区的可用节点上,且可以重新挂载使用原先使用的云盘
  4. 如果业务需要扩容,可以自动完成资源扩充,云盘创建挂载,且尽量做到多可用区均衡部署

方案规划

有状态业务通常为了存储有更高的io性能会选用块存储作为存储设备,但因为块存储只能挂载到相同可用区下的ECS实例上,那么有状态业务跨区部署时,就需要考虑如何保证应用pod及对应的块存储资源始终在一个可用区,不会由于业务pod迁移到了其他可用区无法挂载之前使用的块存储设备而造成故障,为了保障业务的可用性及运维人员的可操作性,我们规划设计如下:

  1. 在三个可用区,分别建一个弹性节点池,配置统一的标签和污点,选用统一的机型,且保证选用的三个可用区有同样的云盘可以使用(比如ESSD),保证只有sts业务可以调度到该组资源中去,避免和其他业务混合部署带来性能或可用性的干扰
  2. 定义一个storageclass,type定义cloud_essd,cloud_ssd,cloud_efficiency(essd会优先创建),同时配置volumeBindingMode为WaitForFirstConsumer,确保在多可用区的集群中调度时,先创建pod,再根据pod所在可用区信息创建云盘
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: sts-sc
provisioner: diskplugin.csi.alibabacloud.com
parameters:
  type: cloud_essd,cloud_ssd,cloud_efficiency
  #regionId: cn-beijing
  #zoneId: cn-beijing-h,cn-beijing-g,cn-beijing-k
  #fstype: ext4
  #diskTags: "a:b,b:c"
  #encrypted: "false"
  #performanceLevel: PL1
  #volumeExpandAutoSnapshot: "forced" #该设置仅在type为"cloud_essd"时生效。
volumeBindingMode: WaitForFirstConsumer
reclaimPolicy: Retain
allowVolumeExpansion: true
  1. 配合上占位pod的能力,用占位pod提前扩容预热一台计算节点,有状态pod可自动调度到占位pod所在节点上,占位pod被驱逐后自动再扩容一台节点做预留

方案落地——多可用区实现同时快速弹性扩容

多可用区实现同时快速弹性扩容,可参考:https://help.aliyun.com/document_detail/410611.html

  1. 在三个可用区创建三个弹性节点池,H, K, G, 分别配置了如下label和污点
label:
  avaliable_zone: k
  usage: sts
taints:
- effect: NoSchedule
  key: usage
  value: sts

label:
  avaliable_zone: g
  usage: sts
taints:
- effect: NoSchedule
  key: usage
  value: sts

label:
  avaliable_zone: h
  usage: sts
taints:
- effect: NoSchedule
  key: usage
  value: sts

  1. 部署placeholder及占位deployment
deployments:
- affinity: {}
  annotations: {}
  containers:
  - image: registry-vpc.cn-beijing.aliyuncs.com/acs/pause:3.1
    imagePullPolicy: IfNotPresent
    name: placeholder
    resources:
      requests:
        cpu: 3000m
        memory: 6
  imagePullSecrets: {}
  labels: {}
  name: ack-place-holder-h
  nodeSelector:
    avaliable_zone: h
  replicaCount: 1
  tolerations:
  - effect: NoSchedule
    key: usage
    operator: Equal
    value: sts
- affinity: {}
  annotations: {}
  containers:
  - image: registry-vpc.cn-beijing.aliyuncs.com/acs/pause:3.1
    imagePullPolicy: IfNotPresent
    name: placeholder
    resources:
      requests:
        cpu: 3000m
        memory: 6
  imagePullSecrets: {}
  labels: {}
  name: ack-place-holder-k
  nodeSelector:
    avaliable_zone: k
  replicaCount: 1
  tolerations:
  - effect: NoSchedule
    key: usage
    operator: Equal
    value: sts
- affinity: {}
  annotations: {}
  containers:
  - image: registry-vpc.cn-beijing.aliyuncs.com/acs/pause:3.1
    imagePullPolicy: IfNotPresent
    name: placeholder
    resources:
      requests:
        cpu: 3000m
        memory: 6
  imagePullSecrets: {}
  labels: {}
  name: ack-place-holder-g
  nodeSelector:
    avaliable_zone: g
  replicaCount: 1
  tolerations:
  - effect: NoSchedule
    key: usage
    operator: Equal
    value: sts
fullnameOverride: ""
nameOverride: ""
podSecurityContext: {}
priorityClassDefault:
  enabled: true
  name: default-priority-class
  value: -1

可以看到,当前集群中,先前定义的3个节点池中,都弹起了一个节点,分别都有一个占位的deployment将pod部署在节点中:

k get deployment                       
NAME                 READY   UP-TO-DATE   AVAILABLE   AGE
ack-place-holder-g   1/1     1            1           18m
ack-place-holder-h   1/1     1            1           18m
ack-place-holder-k   1/1     1            1           18m

# pod分布在三个可用区的三个节点中
k get po -o wide           
NAME                                  READY   STATUS    RESTARTS   AGE    IP            NODE                      NOMINATED NODE   READINESS GATES
ack-place-holder-g-7b87d547d6-2h92f   1/1     Running   0          14m    10.4.48.187   worker.10.4.48.186.g7ne   <none>           <none>
ack-place-holder-h-5cd56f49ff-qpw44   1/1     Running   0          14m    10.1.86.119   worker.10.0.63.207.g7ne   <none>           <none>
ack-place-holder-k-6b5c96457d-vjzhp   1/1     Running   0          14m    10.2.57.72    worker.10.2.57.70.g7ne    <none>           <none>

此时,我们部署一个sts应用:

apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: nginx-dynamic
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  serviceName: nginx
  template:
    metadata:
      labels:
        app: nginx
        usage: sts
    spec:
      affinity:
        podAntiAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
          - labelSelector:
              matchExpressions:
              - key: usage
                operator: In
                values:
                - sts
            topologyKey: kubernetes.io/hostname
            #topologyKey: topology.kubernetes.io/zone
      nodeSelector:
        usage: sts
      tolerations:
      - key: "usage"
        operator: "Equal"
        value: "sts"
        effect: "NoSchedule"
      containers:
      - name: nginx
        image: nginx
        ports:
        - containerPort: 80
          name: web
        resources:
          requests:
            cpu: 2
          limits:
            cpu: 4
        volumeMounts:
        - name: disk-essd
          mountPath: /data
  volumeClaimTemplates:
  - metadata:
      name: disk-essd
    spec:
      accessModes: [ "ReadWriteMany" ]
      storageClassName: "sts-sc"
      resources:
        requests:
          storage: 20Gi

部署上面的statefulset后,可以看到,sts的pod立刻驱逐了占位pod,开始部署业务pod:

k get po -w                                                                  
NAME                                  READY   STATUS              RESTARTS   AGE
ack-place-holder-g-7b87d547d6-vsv8z   0/1     Pending             0          9s
ack-place-holder-h-5cd56f49ff-qpw44   1/1     Running             0          18m
ack-place-holder-k-6b5c96457d-vjzhp   1/1     Running             0          18m
nginx-dynamic-0                       0/1     ContainerCreating   0          9s

被驱逐的占位pod,立马开始触发对应可用区的弹性节点池的扩容,预热一台机器做资源补充:

k get po   
NAME                                  READY   STATUS              RESTARTS   AGE
ack-place-holder-g-7b87d547d6-vsv8z   1/1     Running             0          4m49s
ack-place-holder-h-5cd56f49ff-dbhns   1/1     Running             0          4m17s
ack-place-holder-k-6b5c96457d-xxjqs   0/1     ContainerCreating   0          3m45s
nginx-dynamic-0                       1/1     Running             0          4m49s
nginx-dynamic-1                       1/1     Running             0          4m17s
nginx-dynamic-2                       1/1     Running             0          3m45s

最终,可以看到sts的业务pod调度到了之前占位pod所在的三台机器上(worker.10.4.48.186.g7ne, worker.10.0.63.207.g7ne ,worker.10.2.57.70.g7ne),同时占位pod调度到了新扩容的三台节点上:

k get po -o wide 
NAME                                  READY   STATUS    RESTARTS   AGE     IP            NODE                      NOMINATED NODE   READINESS GATES
ack-place-holder-g-7b87d547d6-vsv8z   1/1     Running   0          7m26s   10.4.48.190   worker.10.4.48.189.g7ne   <none>           <none>
ack-place-holder-h-5cd56f49ff-dbhns   1/1     Running   0          6m54s   10.1.86.121   worker.10.0.63.208.g7ne   <none>           <none>
ack-place-holder-k-6b5c96457d-xxjqs   1/1     Running   0          6m22s   10.2.57.74    worker.10.2.57.73.g7ne    <none>           <none>
nginx-dynamic-0                       1/1     Running   0          7m26s   10.4.48.187   worker.10.4.48.186.g7ne   <none>           <none>
nginx-dynamic-1                       1/1     Running   0          6m54s   10.1.86.119   worker.10.0.63.207.g7ne   <none>           <none>
nginx-dynamic-2                       1/1     Running   0          6m22s   10.2.57.72    worker.10.2.57.70.g7ne    <none>           <none>

总结

通过上述方法,我们成功实现了:

  1. pod多区分布
  2. 根据初次创建的pod所在可用区来创建并挂载云盘
  3. 后续pod重建后,可自动根据云盘所在的可用区信息实现同可用区的正确调度
  4. 如果需要扩容,scale pod可以自动通过占位pod极速拉起业务pod,同时占位pod可继续扩容资源做储备

另外,需要特别注意的是:

  1. 本方案只是从部署层面,帮助有状态应用尽量的高可用性,但有状态的应用,中间件及DB等类型的业务,本身状态数据的一致性并不可以通过这个方式来保障,集群本身的数据一致性机制才是实现状态一致性的核心
  2. 当前只是采用了相对简单的podAntiAffinity来做多区部署,并没有绝对意义上的多区均衡部署,后续结合上k8s的topologySpread机制,可以让多区部署更均衡
相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
1月前
|
人工智能 弹性计算 运维
ACK Edge与IDC:高效容器网络通信新突破
本文介绍如何基于ACK Edge以及高效的容器网络插件管理IDC进行容器化。
|
4天前
|
存储 监控 对象存储
ACK容器监控存储全面更新:让您的应用运行更稳定、更透明
介绍升级之后的ACK容器监控体系,包括各大盘界面展示和概要介绍。
|
22天前
|
Ubuntu Linux 开发工具
docker 是什么?docker初认识之如何部署docker-优雅草后续将会把产品发布部署至docker容器中-因此会出相关系列文章-优雅草央千澈
Docker 是一个开源的容器化平台,允许开发者将应用程序及其依赖项打包成标准化单元(容器),确保在任何支持 Docker 的操作系统上一致运行。容器共享主机内核,提供轻量级、高效的执行环境。本文介绍如何在 Ubuntu 上安装 Docker,并通过简单步骤验证安装成功。后续文章将探讨使用 Docker 部署开源项目。优雅草央千澈 源、安装 Docker 包、验证安装 - 适用场景:开发、测试、生产环境 通过以上步骤,您可以在 Ubuntu 系统上成功安装并运行 Docker,为后续的应用部署打下基础。
docker 是什么?docker初认识之如何部署docker-优雅草后续将会把产品发布部署至docker容器中-因此会出相关系列文章-优雅草央千澈
|
1月前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
本文整理自2024云栖大会冯诗淳(花名:行疾)的演讲,介绍了阿里云容器服务团队在生产级可观测体系建设方面的实践。冯诗淳详细阐述了容器化架构带来的挑战及解决方案,强调了可观测性对于构建稳健运维体系的重要性。文中提到,阿里云作为亚洲唯一蝉联全球领导者的容器管理平台,其可观测能力在多项关键评测中表现优异,支持AI、容器网络、存储等多个场景的高级容器可观测能力。此外,还介绍了阿里云容器服务在多云管理、成本优化等方面的最新进展,以及即将推出的ACK AI助手2.0,旨在通过智能引擎和专家诊断经验,简化异常数据查找,缩短故障响应时间。
阿里云ACK容器服务生产级可观测体系建设实践
|
19天前
|
存储 人工智能 调度
容器服务:智算时代云原生操作系统及月之暗面Kimi、深势科技实践分享
容器技术已经发展成为云计算操作系统的关键组成部分,向下高效调度多样化异构算力,向上提供统一编程接口,支持多样化工作负载。阿里云容器服务在2024年巴黎奥运会中提供了稳定高效的云上支持,实现了子弹时间特效等创新应用。此外,容器技术还带来了弹性、普惠的计算能力升级,如每分钟创建1万Pod和秒级CPU资源热变配,以及针对大数据与AI应用的弹性临时盘和跨可用区云盘等高性能存储解决方案。智能运维方面,推出了即时弹性节点池、智能应用弹性策略和可信赖集群托管运维等功能,进一步简化了集群管理和优化了资源利用率。
|
1月前
|
存储 Kubernetes 容器
K8S部署nexus
该配置文件定义了Nexus 3的Kubernetes部署,包括PersistentVolumeClaim、Deployment和服务。PVC请求20Gi存储,使用NFS存储类。Deployment配置了一个Nexus 3容器,内存限制为6G,CPU为1000m,并挂载数据卷。Service类型为NodePort,通过30520端口对外提供服务。所有资源位于`nexus`命名空间中。
|
1月前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
1月前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。
|
2月前
|
Kubernetes Cloud Native 微服务
云原生入门与实践:Kubernetes的简易部署
云原生技术正改变着现代应用的开发和部署方式。本文将引导你了解云原生的基础概念,并重点介绍如何使用Kubernetes进行容器编排。我们将通过一个简易的示例来展示如何快速启动一个Kubernetes集群,并在其上运行一个简单的应用。无论你是云原生新手还是希望扩展现有知识,本文都将为你提供实用的信息和启发性的见解。
|
2月前
|
安全 持续交付 Docker
深入理解并实践容器化技术——Docker 深度解析
深入理解并实践容器化技术——Docker 深度解析
86 2

相关产品

  • 容器服务Kubernetes版