10 亿月活用户下,快手基于 Dragonfly 的超大规模镜像分发实践

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
可观测监控 Prometheus 版,每月50GB免费额度
简介: Dragonfly 和 Nydus 都是来自 CNCF 的优秀开源项目,更进一步说,快手也将继续对该项目进行更多投入,并与社区展开深入合作,使它变得更加强大和可持续。云原生技术是基础设施领域的一场革命,尤其是在弹性和无服务器方面,我们相信 Dragonfly 一定会在云原生生态中扮演重要角色。

背景


挑战


快手容器云平台旨在为快手不断增长、不断变化和多样化的业务,提供基于容器化部署的超大规模基础设施服务。为了实现这一目标,快手工程师需要解决弹性、稳定性、效率和无服务器架构等挑战,在这些挑战中,镜像分发的稳定性和效率也是最棘手的问题之一。


解决方案


为了让快手容器云平台的镜像分发更加稳定和高效,快手容器云技术团队携手阿里云、蚂蚁集团在龙蜥社区适配优化落地解决方案。事实证明,Dragonfly 及其子项目 Nydus 是当前场景下合适的解决方案,该方案能够与现有系统很好地兼容,在现有能力基础上平滑过渡,同时也为服务交付带来了大幅的效率提升。


效果


Dragonfly 上线后,整个集群通过 P2P 组建分发网,所有节点帮助中心化镜像仓库缓解网络带宽压力。镜像仓库的网络带宽压力平均缓解 70% 以上,峰值压力缓解 80% 以上,镜像分发系统变得更加稳定、可靠、高效,系统能够同时支持更多数量的镜像并发拉取请求,尤其是在应对 Daemonset 部署和关键、大批量实例业务服务更新的场景中,高并发镜像拉取仓库不再是瓶颈。


使用项目



相关数据


峰值缓解 80% 以上    

镜像拉取时间节省 90% 以上    

POD 实例服务耗时节省 50%


方案详解


为每月10 亿用户提供稳定性和性能支持


“在快手,Dragonfly 有效解决了海量文件分发问题。”            

——吴宏斌 快手综合运营平台负责人


对于快手的镜像分发系统升级改造来说,最大的挑战不仅仅是镜像仓库峰值压力的缓解和镜像拉取加速,如何让服务分发无缝衔接平滑过渡,尽可能让业务无感、不受系统变化影响同样重要。快手容器云平台工程师通过调研发现,Nydus 与 Dragonfly 系统深度集成,同时也支持传统 OCI 镜像,能够以兼容友好的方式提供快速、稳定、安全、便捷的容器镜像访问,非常容易地就能适配容器云平台已有工作,实现业务从已有镜像使用方式平滑过渡到新镜像格式。平台唯一要做的就是将容器运行引擎从 Docker 切换到 containerd,因为 containerd 与 Dragonfly 的集成体验更好。在快手工程师的努力下,大规模节点的容器引擎平稳切换轻而易举,containerd 和 Dragonfly 均已被快速全面采用。


稳定高效的镜像分发


对于稳定、高效的镜像分发,Dragonfly 给出了完美的答案。在快手,有许多重要的服务需要在短短几分钟内扩容到成千上万个实例,例如快手的818 购物节或双 11 活动的业务扩容需求。这种缩放需要数千 GB 带宽才能直接从镜像仓库下载。在另外一些场景中,预测模型和搜索业务需要定期更新模型参数文件和索引文件来保证推荐效果和检索效果,这在技术上意味着必须立即将数百 GB 的文件分发到每个相关实例。


快手工程师在所有容器云主机部署了 Dragonfly 组件:Dfdaemon 和 Dfget,通过 P2P 算法拉取文件。同时,在每个 AZ 部署了独立的超级节点集群,为 Dfget 设计了 Schedule Server,选择合适的超级节点来避免跨 AZ 或者跨 Region 的流量。更重要的是,工程师基于 Dragonfly 独特的片管理 P2P 算法实现了数据流 P2P 传输,降低了磁盘负载。得益于 Dragonfly,数以万计的实例可以同时拉取镜像或下载文件,而不会增加时间成本和磁盘负载。


1.png


“先进的技术就是第一生产力,快手容器云平台拥抱 Dragonfly 和 Nydus 后,应用交付效率大幅提升,给业务创新带来了更多可能。”

——孙寅 快手容器云负责人


由于拉取镜像是容器生命周期中比较耗时的步骤之一,为了进一步加速镜像分发和服务启动,工程师们又继续启用了 Nydus 镜像懒加载项目。快手有许多服务有数千个 Pod 实例,其中一些有超过 20G 或更大的镜像,当这些服务升级或扩容时,巨大的镜像和启动时间会严重减慢服务启动。快手需要一种能够显著提高服务启动速度的解决方案,特别是因为某些服务将其训练模型放入镜像中,这对于服务启动来说可能是灾难性的。


由于快手在 Dragonfly 项目上的应用和实施,工程师们很早就了解到 Nydus 项目。Nydus 是一个强大的开源文件系统解决方案,可以为云原生工作负载,例如容器镜像,构建高效的镜像分发系统。


得益于 Nydus 全新的镜像设计,每个 Pod 可以在几秒钟内完成启动,这样可以大量节省服务部署实例的启动时间,让应用尽快为用户提供服务。对于每个集群节点,支持Nydus的工作并不复杂,通过容器引擎无损切换(指无需 POD 驱逐)、配置变更即可顺利完成。


在实践中, 针对快手容器云平台的全局镜像仓库中心,我们做了以下事情:


  1. 容器引擎从 Docker 无损切换到 containerd;
  2. 在镜像构建阶段支持使用 Nydus 标准构建镜像;
  3. 在集群节点间,使用 Dragonfly 的 P2P 技术支持镜像分发;
  4. containerd通过配置Dragonfly 的 P2P 代理拉取镜像,并使用 Nydus 镜像启动容器。


当然,以上所有的变动,都继续兼容当前已有的 OCI 镜像格式以及系统已有功能。


2.png


综上所述,Dragonfly 和 Nydus 一起为快手容器云平台提供了处理镜像分发问题的最佳解决方案。数以万计的快手服务大大减少了部署时间,业务线研发工程师在更新服务时也更加轻松容易。


Dragonfly 和 Nydus 都是来自 CNCF 的优秀开源项目,更进一步说,快手也将继续对该项目进行更多投入,并与社区展开深入合作,使它变得更加强大和可持续。云原生技术是基础设施领域的一场革命,尤其是在弹性和无服务器方面,我们相信 Dragonfly 一定会在云原生生态中扮演重要角色。

相关实践学习
通过容器镜像仓库与容器服务快速部署spring-hello应用
本教程主要讲述如何将本地Java代码程序上传并在云端以容器化的构建、传输和运行。
Kubernetes极速入门
Kubernetes(K8S)是Google在2014年发布的一个开源项目,用于自动化容器化应用程序的部署、扩展和管理。Kubernetes通常结合docker容器工作,并且整合多个运行着docker容器的主机集群。 本课程从Kubernetes的简介、功能、架构,集群的概念、工具及部署等各个方面进行了详细的讲解及展示,通过对本课程的学习,可以对Kubernetes有一个较为全面的认识,并初步掌握Kubernetes相关的安装部署及使用技巧。本课程由黑马程序员提供。   相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
存储 Dragonfly 缓存
带你读《2022龙蜥社区全景白皮书》——5.6.3 容器镜像大规模分发技术Nydus
带你读《2022龙蜥社区全景白皮书》——5.6.3 容器镜像大规模分发技术Nydus
173 5
|
存储 Dragonfly 人工智能
带你读《2022龙蜥社区全景白皮书》——6.1.4 云原生应用场景下的镜像分发加速方案
带你读《2022龙蜥社区全景白皮书》——6.1.4 云原生应用场景下的镜像分发加速方案
258 6
|
人工智能 Kubernetes Cloud Native
【热点追踪】从价值到架构,走近全新升级的阿里云 Serverless 容器服务 ASK
【热点追踪】从价值到架构,走近全新升级的阿里云 Serverless 容器服务 ASK
|
Dragonfly Cloud Native 算法
镜像拉取节省 90% 以上,快手基于 Dragonfly 的超大规模分发实践
快手容器云技术团队携手阿里云、蚂蚁集团在龙蜥社区适配,优化落地解决方案。
镜像拉取节省 90% 以上,快手基于 Dragonfly 的超大规模分发实践
|
弹性计算 Kubernetes Cloud Native
招商银行 KubeVela 离线部署实践
本文将以 KubeVela v1.2.5 版本为例,介绍招商银行 KubeVela 的离线部署实践,来帮助其他用户在离线环境中更便捷的完成 KubeVela 的部署。
576 8
招商银行 KubeVela 离线部署实践
|
存储 缓存 运维
Amazon ElastiCache 飞速搭建缓存服务集群,这才叫快
Amazon ElastiCache 飞速搭建缓存服务集群,这才叫快
262 0
Amazon ElastiCache 飞速搭建缓存服务集群,这才叫快
|
Kubernetes Cloud Native 调度
OpenKruise 如何实现 K8s 社区首个规模化镜像预热能力
OpenKruise 是阿里云开源的云原生应用自动化管理套件,也是当前托管在 Cloud Native Computing Foundation (CNCF) 下的 Sandbox 项目。它来自阿里巴巴多年来容器化、云原生的技术沉淀,是阿里内部生产环境大规模应用的基于 Kubernetes 之上的标准扩展组件,也是紧贴上游社区标准、适应互联网规模化场景的技术理念与最佳实践。
OpenKruise 如何实现 K8s 社区首个规模化镜像预热能力
|
弹性计算 Kubernetes Cloud Native
国内首篇云厂商 Serverless 论文入选全球顶会:突发流量下,如何加速容器启动?
FaaSNet 是国内首个云厂商在国际顶级会议发表 Serverless 场景下应对突发流量的加速容器启动技术的论文。
2514 0
国内首篇云厂商 Serverless 论文入选全球顶会:突发流量下,如何加速容器启动?
|
Kubernetes Cloud Native 安全
OpenKruise v0.8.0 版本发布:K8s 社区首个规模化镜像预热能力
OpenKruise 是阿里云开源的云原生应用自动化管理套件,也是当前托管在 Cloud Native Computing Foundation (CNCF) 下的 Sandbox 项目。它来自阿里巴巴多年来容器化、云原生的技术沉淀,是阿里内部生产环境大规模应用的基于 Kubernetes 之上的标准扩展组件,紧贴上游社区标准、适应互联网规模化场景的技术理念与最佳实践。
OpenKruise v0.8.0 版本发布:K8s 社区首个规模化镜像预热能力
|
算法 Devops 大数据
Aliware推出应用配置管理大杀器,分布式架构下配置推送秒级生效!
近日,阿里中间件(Aliware)产品家族又推出了一款工具类产品——应用配置管理(ACM),它的主要功能是解决在分布式架构环境中,对应用配置进行集中管理和推送的问题。
5229 5
下一篇
无影云桌面