聚焦边缘计算场景,打造云边端一体化容器云平台

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 8月26日的2022亚太内容分发大会暨CDN峰会上,阿里云技术专家徐若晨受邀作客【边缘计算论坛】并发表了题为《边缘容器云平台的探索和实践》的精彩演讲。

随着大带宽、低延时、多连接的应用场景迎来爆发,CDN的技术底座不断向边缘演进。当前边缘计算已经成为企业关键增长要素,驱动全球企业级基础架构市场持续增长,为构建分布式云提供最直接、距离最近的算力支持。


8月26日的2022亚太内容分发大会暨CDN峰会上,阿里云技术专家徐若晨受邀作客【边缘计算论坛】并发表了题为《边缘容器云平台的探索和实践》的精彩演讲,基于阿里云大规模边缘容器云平台展开介绍阿里云边缘容器云平台的发展背景、历程、设计与架构,深入解析了阿里云边缘容器云平台上的典型业务场景与实践案例,本文为整理内容。



立足于用户视角 构建“云边端”一体化平台


从用户视角出发,当前在边缘侧业务面临挑战众多:

  • 自建边缘机房交付周期长、资产重;
  • 边缘集群常态化裁撤、割接,SLA难保障;
  • 单集群业务规模小、弹性差;
  • 属地性应用多,集群维护成本高、难度大;


通过在中心和客户现场之间,构建起边缘云这一层服务,就能够解决以上问题。边缘云为用户带来的对应方面价值主要体现在:


  • 提升效率:为终端提供距离更近、时延更低的算力资源,支持时效性强、交互性强的业务场景,实现秒级算力交付;
  • 降低成本:通过终端上移这一手段有效提升部分业务灵活性,实现按量付费、弹性扩容,降低客户的成本;
  • 易运维:采用云原生交付方式,提升边缘应用可运维性,降低客户运维投入
  • 低时延、提升用户体验:基于海量低延时的边缘集群资源覆盖,为客户提供时延更低的体验;


基于“云-边-端”的架构模式,边缘云实现了云端算力下沉与终端算力上移:

  • 云端算力下沉:通过将应用、算力分布式部署边缘,从而卸载掉中心Region核心服务的负载。考虑到中心Region带宽的成本远高于边缘,因此对于带宽较大的业务,在边缘云实现流量的收敛再回到中心,能够大幅度缩减带宽的成本,为客户提供离终端更近的算力资源,提升业务交互性与时效性;

  • 终端算力上移:对终端应用进行瘦身的同时为应用开发者提供标准化运维与云边体验一致的开发过程,帮助快速开发、迭代。对比终端应用,边缘云拥有更加丰富的生态,提升业务灵活性。除此之外,边缘上提供专属GPU硬件,进一步优化应用性能。


深度解析边缘容器云平台架构 精准应对技术挑战


边缘容器云平台技术挑战边缘容器云平台的技术挑战主要是来自于三方面:

首先是集群规模小而多受限于边缘的物理环境,单个集群的规模通常有限。随着资源的进一步下沉,终端算力的进一步上移,各类资源被纳管到边缘云中,资源规模迅速增长,边缘规模呈现出小型化、广覆盖的特点,为资源管控、弹性调度带来技术挑战;


二是边缘环境复杂。处于边缘的设备工作状态与条件对比数据中心更差,往往存在弱网、断网等情况,对于边缘自治、云边协同、边边协同、跨节点迁移能力、故障逃逸能力提出较高要求;


三是边缘基础设施异构出于成本考量、业务定制化需求的考量,硬件操作系统、网络结构等方面存在明显异构场景,给资源的云化纳管工作造成困难;



边缘容器云平台架构



物理资源层包括多云融合资源、MEC、ARM阵列、自有节点、多云融合资源等,上层为资源建设与运维平台,提供基础的IaaS服务。


中间层从下往上,首先由异构资源纳管部分负责将IaaS资源以k8s节点形式接入k8s集群中;正如前文所述,单一的或少量的k8s集群无法容纳所有资源,所以基于异构资源纳管层需要构建多集群管理与调度融合能力,为上层提供标准的k8s界面;在标准k8s界面的基础上进行边缘能力的加强,包括边缘容器镜像、边缘工作负载、边缘服务网格、边缘应用管理等。


最顶层是边缘能力开放层,通过提供OpenAPI、开发者工具、能力开放平台等,使得用户、开发者可以通过开放层去使用阿里云边缘容器平台的各项能力来管理自己的业务。


针对中间层的边缘容器云平台将展开进行介绍:


异构资源纳管



异构资源纳管核心功能是将边缘资源以k8s节点形式接入集群,如图所示为标准化接入流程,适配了MEC、ARM等各种业务场景。接入过程中同时感知集群水位分布与边缘资源网络状态等多维度指标,选择最优接入集群,基于组件预置等技术方案减少接入过程中如组件安装、下载等时间成本,加速接入流程。


多集群管理



多集群管理流程如图所示,客户通过虚拟集群创建工作负载与pod,基于全域融合调度器,实时感知资源集群状态选择最优调度结果,将结果反馈租户虚拟集群中,利用同步器进行向下同步生产工作。


过程中将k8s集群分为两类,资源集群与为租户创建的独立虚拟集群。通过多层树状拓扑结构使每一个独立虚拟集群能够通过原生k8s语义使用全域边缘资源,并且提升了租户间的隔离性。


对于k8s集群的读操作通过统一事件总线完成,而非直接对k8s集群进行操作。因此每个k8s集群都能有效控制集群上的客户端数量,减少服务器上list-watch的消耗,并且使系统具备水平扩展能力。


全域融合调度在模型中作为k8s集群的总调度器,类比于大脑这一角色,有效实现了全域资源的多维度实时感知与多层次调度。


边缘特性增强


由于边缘资源单集群数量较多,因此需要通过单元化管理的概念将其映射到边缘的多个集群上,同时完成单元间的并行分发,以此提升业务发布效率。阿里云通过自研适配边缘场景的工作负载,对每一台机器上的每一个pod版本更新实现精准控制,使得系统更契合边缘异构场景上的容器与多开场景。


基于阿里云内容分发网络的技术与生态优势,构建出具备全网缓存与加速能力的边缘镜像服务,对于大规模流量并发提供支持,实现容器扩容,提高创建速度。


稳定性体系


基于阿里云内容分发网络构建的管控命令传播网络,使管控命令可以低延迟,高触达地下发到机器上执行。目前所有的云边管控操作都通过云边管控通道实现,在边缘节点出现异常的情况下,将按照异常上报,由中心进行处理策略匹配工作,熔断检查,最后将自动化处理策略下发至边缘节点形成闭环。


风控中心组件除去前文提到的熔断检查工作,还具备高危操作拦截能力,如k8s集群中大量node删除、pod对象删除、工作负载删除、权限修改、大规模标签修改等,帮助客户业务实现稳定运行,为系统保驾护航。


两大典型业务场景 构建边缘容器云平台最佳实践


中心业务下沉


日志网关下沉场景,包括httpdns、内容安全识别下沉,本质都是中心业务的下沉。


终端通过请求调度寻找边缘节点,通过边缘网关服务将日志上报到容器中,此处请求调度与容器调度是协同工作的。例如业务容器CPU内存消耗的水位,将会影响请求调度的策略生成,水位高的情况下对请求调度节点进行修改。此外,请求调度同时影响容器调度,例如在集群副本数不够的情况下,触发容器调度对容器进行扩容操作。二者相互协同工作实现日志下沉。


中心下沉场景业务逻辑本质是通过云边端协同操作,节省中心带宽成本,降低接入延时,为客户打造最佳使用体验。



终端上云


机顶盒上云是终端上云场景的一类典型应用场景,同类场景还包括云手机、云游戏等。


管理员通过应用管理中心,通过阿里云自研工作负载与多集群管理等方式将容器运行在边缘服务器上。如图所示为一组多开容器实例,通过自研工作负载精准控制每一个服务器上的每一个容器版本。同时,阿里云与英特尔合作,于服务器上安装Intel Server dGPU,对终端流化渲染性能实现进一步提升。


终端上云场景中,核心应用上移帮助终端瘦身,将更多的应用运维与管理开发工作集中在边缘,实现了对业务灵活性与使用性能的优化。



更多边缘云产品资讯欢迎访问【阿里云边缘云】或扫码关注【阿里云Edge Plus】

qrcode_for_gh_0cf3488f3334_258.jpg

边缘云 开启分布式云网融合新时代

目录
相关文章
|
3天前
|
存储 人工智能 边缘计算
AI时代下, 边缘云上的技术演进与场景创新
本文介绍了AI时代下边缘云的技术演进与场景创新。主要内容分为三部分:一是边缘云算力形态的多元化演进,强调阿里云边缘节点服务(ENS)在全球600多个节点的部署,提供低时延、本地化和小型化的价值;二是边缘AI推理的创新发展与实践,涵盖低时延、资源广分布、本地化及弹性需求等优势;三是云游戏在边缘承载的技术演进,探讨云游戏对边缘计算的依赖及其技术方案,如多开技术、云存储和网络架构优化,以提升用户体验并降低成本。文章展示了边缘云在未来智能化、实时化解决方案中的重要性。
|
18天前
|
人工智能 运维 监控
容器服务Kubernetes场景下可观测体系生产级最佳实践
阿里云容器服务团队在2024年继续蝉联Gartner亚洲唯一全球领导者象限,其可观测体系是运维的核心能力之一。该体系涵盖重保运维、大规模集群稳定性、业务异常诊断等场景,特别是在AI和GPU场景下提供了全面的观测解决方案。通过Tracing、Metric和Log等技术,阿里云增强了对容器网络、存储及多集群架构的监控能力,帮助客户实现高效运维和成本优化。未来,结合AI助手,将进一步提升问题定位和解决效率,缩短MTTR,助力构建智能运维体系。
|
5月前
|
边缘计算 Kubernetes Cloud Native
边缘计算问题之边缘资源的不同场景对资源分配和算力如何解决
边缘计算问题之边缘资源的不同场景对资源分配和算力如何解决
98 1
|
1月前
|
缓存 Serverless 调度
Moka:ACS 容器计算服务助力CI/CD场景提效降本 70%
Moka,作为国内发展最快的HR SaaS厂商之一,在ACS产品初期就与阿里云产品团队紧密联系产品需求及体验反馈,本文将着重分享我们使用ACS在CI/CD 场景的最佳实践。
|
1月前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
2月前
|
边缘计算 监控 自动驾驶
揭秘云计算中的边缘计算:架构、优势及应用场景
揭秘云计算中的边缘计算:架构、优势及应用场景
|
4月前
|
容器 云栖大会
|
4月前
|
负载均衡 大数据 测试技术
docker容器技术有哪些应用场景?
docker容器技术有哪些应用场景?
254 5
|
4月前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
2024年云栖大会,我们总结过往支持AI智算基础底座的实践经验、发现与思考,给出《容器服务在AI智算场景的创新与实践》的演讲。不仅希望将所做所想与客户和社区分享,也期待引出更多云原生AI领域的交流和共建。
|
5月前
|
存储 边缘计算 Kubernetes
边缘计算问题之边缘计算平台建设中业务应用践行云原生体系如何解决
边缘计算问题之边缘计算平台建设中业务应用践行云原生体系如何解决
71 1