阿里云 ACK 集群控制器 | 学习笔记

简介: 快速学习阿里云 ACK 集群控制器

开发者学堂课程【企业级运维之云原生与 Kubernets 实战课程:阿里云 ACK 集群控制器 】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/913/detail/14605


阿里云 ACK 集群控制器

目录

Ÿ 控制器列表

Ÿ kube-controller-manager

Ÿ cloud-controller-manager

Ÿ kube-proxy

Ÿ 最佳实践

 

一、 控制器列表

控制平面的组件对集群做出全局决策(比如调度),以及检测和响应集群事件(例如:当不满足部署的 replicas 字段时,启动新的 Pod )。

1. 控制器列表

image.png

2. 控制器分类

image.png

3. Kube-scheduler

Kube-scheduler 是比较常用的控制器组件,负责监听 Kube API server ,比如新创建的、未指定运行节点( Node )的 Pods,并基于其约束和可用资源为这些 Pods选择适合的节点。

调度决策需要考虑的因素:

Ÿ 如何保障每个节点都会被分配,使资源得以高效利用;

Ÿ 调度性能高,可尽快完成大批量调度工作;

Ÿ 允许用户根据自身需求设定调度策略。

 

二、Kube Controller Manager(KCM)

Kube Controller Manager 是 Kubernetes 集群内部资源的管理器,通过 API 服务器监控集群的状态,确保集群处于预期的工作状态。

Kube Controller Manager 由负责不同资源的多个控制器构成,包含:Node Controller、ReplicaSet、Endpoints Controller、Deployment Controller、ServiceAccount&TokenController 等。

1. Node Controller

Node Controller 负责在节点出现故障时进行通知和响应。

2. ReplicaSet Controller

ReplicaSet Controller 负责为系统中的每个副本控制器对象维护正确数量的 Pod。

3. Endpoints Controller

Endpoints Controller 负责填充端点( Endpoints )对象(即加入 Service 与Pod ),比如:如果监测到 Pod 事件(新建或更新),则更新它对应的 Service Endpoints 对象。

4. Deployment Controller

Deployment Controller 负责管理 Deployment 资源。

5. ServiceAccount&TokenController

ServiceAccount&TokenController 负责为新的命名空间创建默认账户和 API 访问令牌。

 

三、Cloud Controller Manager(CCM)

Cloud Controller Manager 提供 Kubernetes 与阿里云基础产品的对接能力,例如 CLB (原 SLB )、VPC 等。

1. CCM 主要功能

CCM 主要提供以下两方面功能:

Ÿ 管理负载均衡

当 Service 的类型设置为 Type=LoadBalancer 时,CCM 组件会为该 Service 创建或配置阿里云负载均衡 CLB ,包括含 CLB 、监听、后端服务器组等资源。当Service 对应的后端 Endpoint 或者集群节点发生变化时,CCM 会自动更新 CLB 的后端虚拟服务器组;

Ÿ 实现跨节点通信

当集群网络组件为 Flannel 时,CCM 组件负责打通容器与节点间网络,实现容器跨节点通信。CCM 会将节点的Pod网段信息写入 VPC 的路由表中,从而实现跨节点的容器通信。该功能无需配置,安装即可使用。

2. CCM 组件

a. Node Controller

Node Controller 用于在节点发生变化时自动更新 CLB 的后端。

b. Route Controller

Route Controller 用于在底层云基础架构中设置路由。

c. Service Controller

Service Controller 用于创建、更新和删除云提供商负载均衡器。

 

四、kube-proxy

kube-proxy 是 Node 上的网络代理组件,以 DamonSet 的形式工作在每一个节点,是实现 Service 负载均衡的控制器。

image.png

kube-proxy 支持 iptables 和 ipvs 两种模式,Kube-proxy 的作用是管理 Service 的 endpoint,更新 endpoint 到 iptables 或 ipvs 中。

ipvs 模式和 iptables 模式之间的差异如下:

Ÿ ipvs 为大型集群提供了更好的可扩展性和性能,当服务大于 1000 时,ipvs 的性能明显优于 iptables;

Ÿ ipvs 支持比 iptables 更复杂的负载平衡算法(最小负载,最少连接,位置,加权等);

Ÿ ipvs 支持服务器健康检查和连接重试等;

因此,目前更推荐使用 ipvs 模式。

 

五、最佳实践

1. 实践场景描述

SLB 设置了 externalTrafficPolicy:Local 类型,这种类型的 SLB 地址只有在 Node 中部署了对应的后端 Pod,才能被访问。因为 SLB 的地址是集群外使用,如果集群节点和 Pod 不能直接访问,请求不会到 SLB,会被当作 Service 的扩展 IP 地址,被 kube-proxy 的 iptables 或 ipvs 转发。

2. 解决方案

方案一:

在 Kubernetes 集群内通过 ClusterIP 或者服务名访问。

方案二:

将 LoadBalancer 的 Service 中的 externalTrafficPolicy 修改为 cluster ,但是在应用中会丢失源 IP,Ingress 的服务修改命令如下:

kubectl edit svc nginx-ingress-b-nkube-system

Ÿ 如果要保留原 IP,Pod 需要用 hostnetwork 方式,在 Pod 的 spec 里加上: dnspolicy: ClusterFirstWithHostNet

hostNetwork: true

service 的 metadata 里加上:

annotations:

servicebeta.kubenetes.io/bACKend-type: eni

Ÿ 如果是 terway 集群,除了将 LoadBalancer 的 Service 中的 externalTrafficPolicy 修改为 Cluster 之外,还要直挂e ni :添加 service.beta.kubernetes.io/bACKend-type: eni

 

本讲小结

1. 集群中核心控制器的基本作用。

2. Kube-proxy 负载均衡的原理。

image.png

思考:

1. 为什么集群内无法访问 service 的 externalIP,该怎么解决?

2. 添加新的节点,Pod 网络不通,该怎么排查?

3. service 的几种类型,kube-proxy 如何实现负载均衡的?

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
2月前
|
人工智能 算法 调度
阿里云ACK托管集群Pro版共享GPU调度操作指南
本文介绍在阿里云ACK托管集群Pro版中,如何通过共享GPU调度实现显存与算力的精细化分配,涵盖前提条件、使用限制、节点池配置及任务部署全流程,提升GPU资源利用率,适用于AI训练与推理场景。
297 1
|
2月前
|
弹性计算 监控 调度
ACK One 注册集群云端节点池升级:IDC 集群一键接入云端 GPU 算力,接入效率提升 80%
ACK One注册集群节点池实现“一键接入”,免去手动编写脚本与GPU驱动安装,支持自动扩缩容与多场景调度,大幅提升K8s集群管理效率。
261 89
|
7月前
|
资源调度 Kubernetes 调度
从单集群到多集群的快速无损转型:ACK One 多集群应用分发
ACK One 的多集群应用分发,可以最小成本地结合您已有的单集群 CD 系统,无需对原先应用资源 YAML 进行修改,即可快速构建成多集群的 CD 系统,并同时获得强大的多集群资源调度和分发的能力。
297 9
|
7月前
|
资源调度 Kubernetes 调度
从单集群到多集群的快速无损转型:ACK One 多集群应用分发
本文介绍如何利用阿里云的分布式云容器平台ACK One的多集群应用分发功能,结合云效CD能力,快速将单集群CD系统升级为多集群CD系统。通过增加分发策略(PropagationPolicy)和差异化策略(OverridePolicy),并修改单集群kubeconfig为舰队kubeconfig,可实现无损改造。该方案具备多地域多集群智能资源调度、重调度及故障迁移等能力,帮助用户提升业务效率与可靠性。
344 10
|
3月前
|
存储 Kubernetes 网络安全
关于阿里云 Kubernetes 容器服务(ACK)添加镜像仓库的快速说明
本文介绍了在中国大陆地区因网络限制无法正常拉取 Docker 镜像的解决方案。作者所在的阿里云 Kubernetes 集群使用的是较旧版本的 containerd(1.2x),且无法直接通过 SSH 修改节点配置,因此采用了一种无需更改 Kubernetes 配置文件的方法。通过为 `docker.io` 添加 containerd 的镜像源,并使用脚本自动修改 containerd 配置文件中的路径错误(将错误的 `cert.d` 改为 `certs.d`),最终实现了通过多个镜像站点拉取镜像。作者还提供了一个可重复运行的脚本,用于动态配置镜像源。虽然该方案能缓解镜像拉取问题,
420 3
|
9月前
|
存储 Kubernetes 监控
K8s集群实战:使用kubeadm和kuboard部署Kubernetes集群
总之,使用kubeadm和kuboard部署K8s集群就像回归童年一样,简单又有趣。不要忘记,技术是为人服务的,用K8s集群操控云端资源,我们不过是想在复杂的世界找寻简单。尽管部署过程可能遇到困难,但朝着简化复杂的目标,我们就能找到意义和乐趣。希望你也能利用这些工具,找到你的乐趣,满足你的需求。
890 33
|
9月前
|
Kubernetes 开发者 Docker
集群部署:使用Rancher部署Kubernetes集群。
以上就是使用 Rancher 部署 Kubernetes 集群的流程。使用 Rancher 和 Kubernetes,开发者可以受益于灵活性和可扩展性,允许他们在多种环境中运行多种应用,同时利用自动化工具使工作负载更加高效。
520 19
|
9月前
|
人工智能 分布式计算 调度
打破资源边界、告别资源浪费:ACK One 多集群Spark和AI作业调度
ACK One多集群Spark作业调度,可以帮助您在不影响集群中正在运行的在线业务的前提下,打破资源边界,根据各集群实际剩余资源来进行调度,最大化您多集群中闲置资源的利用率。
|
9月前
|
安全 持续交付 云计算
课时5:阿里云容器服务:最原生的集成Docker和云服务
阿里云容器服务以服务化形式构建容器基础设施,大幅提升开发效率,简化应用部署流程。通过Docker容器和DevOps工具(如Jenkins),实现自动化部署与迭代,优化企业内部复杂部署问题。该服务支持GPU调度、混合云架构无缝迁移,并与阿里云产品体系无缝集成,提供安全防护、网络负载均衡等多重功能支持。凭借微服务架构,帮助企业突破业务瓶颈,提高资源利用率,轻松应对海量流量。
341 0
课时5:阿里云容器服务:最原生的集成Docker和云服务
|
存储 Kubernetes Docker
容器服务ACK常见问题之阿里云控制台进不去了如何解决
容器服务ACK(阿里云容器服务 Kubernetes 版)是阿里云提供的一种托管式Kubernetes服务,帮助用户轻松使用Kubernetes进行应用部署、管理和扩展。本汇总收集了容器服务ACK使用中的常见问题及答案,包括集群管理、应用部署、服务访问、网络配置、存储使用、安全保障等方面,旨在帮助用户快速解决使用过程中遇到的难题,提升容器管理和运维效率。

推荐镜像

更多