客户简介
合阔智云成立于 2011 年, 核心是云原生和移动化设计的新一代全渠道“云端一体” 履约中台和去中心化模式智能门店供应链业务中台。
客户痛点
开源项目易用性差 : 客户采用 Linkerd 社区版搭建 Service Mesh 基础设施, 无法与阿里云提供的云上基础设施进行很好的融合。例如,Sidecar 使用默认配置,控制能力相对较少,在应对一些复杂的场景时无法灵活配置。Linkerd 的应用可观测性较简单,无法观测到偶发的链路熔断和某个端口无法访问的场景。
链路调用复杂治理难 : 随着应用数量的增加, 应用链路调用变得更加复杂。客户采用 gRPC 协议,但应用端没有做特别处理,导致基于 HTTP2 的长连接协议无法实现负载均衡,尤其是在单个客户端调用变大的情况下, 服务端无法有效负载。应用本身比较薄, 导致应用调用链路无法透明化,每次新的发布部署容易出问题。
数据平面集群的资源消耗大 : 客户的数据平面 Kubernetes 集群中的工作负载数量比较多。默认情况下,Sidecar 会增加对数据平面集群的资源消耗,同时控制平面会面临较大的配置推送负担,降低控制平面的效率和可用性。
方案亮点
商业版架构和社区版一致,云上易用性强 : 服务网格 ASM 的架构与 Istio 社区版和业界趋势保持一致,并在托管的控制面侧提供了用于支撑精细化流量管理和安全管理的组件能力。控制面的托管解除了与所管理的 Kubernetes 集群生命周期的绑定, 使得架构更加灵活, 提升了系统的可伸缩性。自带的可观测面板清晰展现各种问题, 例如不合理的应用补偿策略、 不合理的应用部署、 不合理的应用报错。问题一清二楚,进而非常方便地推动应用架构的改造。
企业级治理能力丰富,提升可用性 : 相比 Istio 社区版,ASM 提供了更加丰富的企业级治理能力,如流量标签、灰度发布、熔断、限流等能力。
配置推送优化资源利用率 : 通过 ASM 的配置推送优化, 可以通过分析数据平面 Sidecar 产生的访问日志, 获取数据平面服务之间的调用依赖关系, 为每个工作负载自动推荐 Sidecar 资源, 减少配置推送负担,提升资源利用率。
建设成果
将 Linkerd 社区版本迁移到服务网格 ASM (阿里云提供的 Istio 云上商业版), 高效解决了多语言技术栈情况下应用链路调用复杂的运维难题, 并解决了与云上其他产品搭配使用时的易用性问题, 从而使运维效率提升了 40%。同时, 借助 ASM 提供的丰富的企业级能力和完备的可观测能力, 构建服务网格的实施周期缩短了 50%。
相关产品
服务网格 ASM
2 容器服务 ACK
3 Serverless 容器服务
4 弹性容器实例 ECI