当Kubernetes应用遇到阿里分批发布模式

简介: 对于熟悉Kubernetes的用户来说,应该知道当你的应用程序一旦部署到Kubernetes以后,Kubernetes能够自动帮你管理应用程序,当Pod发生故障后可以自动调度重建,确保服务的持续可用。


扫码或点我直达 免费领!


对于熟悉Kubernetes的用户来说,应该知道当你的应用程序一旦部署到Kubernetes以后,Kubernetes能够自动帮你管理应用程序,当Pod发生故障后可以自动调度重建,确保服务的持续可用。但Kubernetes的原生发布策略难以满足生产级别的发布要求。 本文将介绍一种在阿里巴巴常用的应用发布模式:分批发布,以及在云效是如何在Kubernetes是如何实现这种发布模式的。

Kubernetes的滚动升级

Kubernetes的RollingUpdate(滚动更新)是Kubernetes提供的原生服务升级策略。意图通过该方式在不停止对外服务的前提下完成对应用的更新。

在原生RollUpdate中用户可以设置升级策略,如maxSurge和maxUnavailable控制Pod启动策略以及最大不可用Pod数,来确保可以Pod能够在滚动升级中不出现没有可用Pod的情况。

对于Kubernetes老手来说,肯定也会加上livenessProbe与readinessProbe探针,来确认服务是否可用。

但是,理想总是丰满,现实总是骨干。在现实的发布过程中,服务升级成功了镜像也启动成功了。 但是并不意味着你这次的“发布”完成了。

关注持续交付领域的朋友,可能会听过各种发布策略,比如蓝绿发布、灰度发布等等。 这些发布策略,寻根溯本,都是为了将部署与发布进行分离,在服务真正上线之前能够有人工介入的机会确保这次升级是是真正的满足业务需求的。

阿里巴巴分批发布模式
分批发布是在阿里巴巴内部大量使用的一种服务发布上线方式。 分批发布简单来说就是按照一定的批次,每次只对服务的一部分实例进行升级。


分批发布一个很重要的动作就是暂停,在暂停后,用户可以手动对新升级的实例进行验证,如果确认一切无误后,再继续后批次服务实例的升级动作。

分批发布的重要的意义在于提供了人工或自动(无人值守发布)介入发布过程验证的功能,以及一旦发现问题快速回滚的能力。

在Kubernetes上实现分批发布
在Kubernetes的应用模型中,Pod和Pod之间一般不进行直接的通讯,所有内部应用之间的流量或者集群外部的流量都需要通过一个单独的Serviec对象。


在云效的部署模型中,我们将Service抽象为一个部署的目标应用。 在执行分批发布过程中,我们会自动为当前Service关联的Deployment对象创建一个新版本的副本。用户可以为整个分批发布过程中定义一个执行批次。

如下所示,在分批发布过程中,云效通过控制当前版本以及新版本Deployment对象的副本数,来控制不同版本Pod的实例数:

在第一批发布完成后,整个过程将会自动暂停。 此时,用户可以直接到集群中对部署结果进行验证,在验证无误的情况下确认是否继续后续的发布过程,而如果用户判断发布存在异常,则可以直接对整个发布过程进行回滚,应用自动回滚到发布前状态:
在整个分批发布过程中为了确保Service流量不会进行到启动中的Pod实例,结合使用LivenessProbe和ReadinessProbe可以确保整个发布过程中服务的持续可用。

使用Istio增强分批发布发布能力
在Kubernetes原生的Service负载均衡实现中,其通过iptable实现从ClusterIP到PodIP的流量路由,其中利用了iptables的--probability的特性来实现分流。


在上面的例子中,如果分批发布为2批,那么新版和旧版Pod会各有50%左右的流量进入。在基于原生Kubernetes的分批发布策略中可以通过增加应用的副本数(Replicas)来控制新版本和旧版本之间的流量比例。

而云效的分批发布策略对于已经使用Istio的用户,则可以轻松实现更精细化的流量控制规则。云效在发布过程中会自动为Deployment实例添加版本标签。

基于版本标签,Istio用户可以通过RouteRule轻松控制不同版本之间的流量比例或者是基于Cookie直接实现AB Test的能力。

当然,后续云效会直接将这部分能力集成到整个流水线过程中,让整个过程变的更加顺滑。

云效 Kubernetes分批发布详细教程:https://help.aliyun.com/document_detail/96666.html

关于云效:

云效,一站式企业协同研发云,源于阿里巴巴多年先进的管理理念和工程实践,提供从“需求->开发->测试->发布->运维->运营”端到端的协同服务和研发工具支撑。支持公有云、专有云和混合云的协同研发,助力企业产品快速创新迭代和研发效能升级。

f63f973efedc4a60527fa0f9f4ea49062080e738

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
11月前
|
缓存 Kubernetes Docker
GitLab Runner 全面解析:Kubernetes 环境下的应用
GitLab Runner 是 GitLab CI/CD 的核心组件,负责执行由 `.gitlab-ci.yml` 定义的任务。它支持多种执行方式(如 Shell、Docker、Kubernetes),可在不同环境中运行作业。本文详细介绍了 GitLab Runner 的基本概念、功能特点及使用方法,重点探讨了流水线缓存(以 Python 项目为例)和构建镜像的应用,特别是在 Kubernetes 环境中的配置与优化。通过合理配置缓存和镜像构建,能够显著提升 CI/CD 流水线的效率和可靠性,助力开发团队实现持续集成与交付的目标。
|
11月前
|
存储 监控 对象存储
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
针对本地存储和 PVC 这两种容器存储使用方式,我们对 ACK 的容器存储监控功能进行了全新升级。此次更新完善了对集群中不同存储类型的监控能力,不仅对之前已有的监控大盘进行了优化,还针对不同的云存储类型,上线了全新的监控大盘,确保用户能够更好地理解和管理容器业务应用的存储资源。
658 267
|
存储 Kubernetes 持续交付
介绍一下Kubernetes的应用场景
【10月更文挑战第18天】介绍一下Kubernetes的应用场景。
1021 3
|
10月前
|
Kubernetes 持续交付 开发工具
阿里云协同万兴科技落地ACK One GitOps方案,全球多机房应用自动化发布,效率提升50%
阿里云协同万兴科技落地ACK One GitOps方案,全球多机房应用自动化发布,效率提升50%
408 2
|
9月前
|
存储 监控 对象存储
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
282 0
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
|
10月前
|
存储 监控 对象存储
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
215 1
|
10月前
|
Kubernetes 持续交付 开发工具
阿里云协同万兴科技落地ACK One GitOps方案,全球多机房应用自动化发布,效率提升50%
阿里云协同万兴科技落地ACK One GitOps方案,全球多机房应用自动化发布,效率提升50%
|
监控 持续交付 Docker
Docker容器化部署在微服务架构中的应用
Docker容器化部署在微服务架构中的应用
575 60
|
11月前
|
存储 监控 对象存储
ACK容器监控存储全面更新:让您的应用运行更稳定、更透明
介绍升级之后的ACK容器监控体系,包括各大盘界面展示和概要介绍。
|
10月前
|
运维 分布式计算 Kubernetes
ACK One多集群Service帮助大批量应用跨集群无缝迁移
ACK One多集群Service可以帮助您,在无需关注服务间的依赖,和最小化迁移风险的前提下,完成跨集群无缝迁移大批量应用。

推荐镜像

更多