客户简介
小鹏汽车成立于 2014 年,是一家专注未来出行的科技公司。一直坚持饱和式研发投入,构建全栈自研的核心能力,今天小鹏汽车已经成为中国领先的智能电动汽车公司之一。
客户痛点
数据处理链路复杂 : 自动驾驶车联网数据链路长且数据增长快,因此数据时效性要求高。
自动驾驶 AI 服务资源利用率低 : 缺乏有效的 AI 模型 GPU 训练和推理优化。
可观测系统不完善 : 前端 Web 和后端服务缺乏有效的监控和分析, 同时自建 Prometheus 稳定性不佳。
支撑平台技术栈复杂 : 技术平台需要支持多种业务, 并且需要建设如Workflflow CI 工作流、SRE 等工具平台,技术栈较为复杂。
方案亮点
阿里云云原生产品支持了小鹏汽车多个业务的技术平台建设。小鹏数据处理、 AI 训练与推理服务、工作流、SRE 运维设施均通过 ACK 统一容器技术栈进行承载。
弹性算力支持复杂数据处理 : 通过容器服务 ACK 运行数据处理和数据脱敏任务, 容器为实时任务提供了弹性算力。
提升训练和仿真资源利用率 : ACK 云原生 AI 套件支持了小鹏自动驾驶大规模训练和仿真任务的调度和管理, 提高了训练和仿真资源的利用率。同时, AI 套件还支持了小鹏互联网技术中台和鹏行业务的 NLP、 ASR 等推理业务。ACK GPU 共享调度和隔离能力, 成倍地提高了 GPU 资源的利用率。
全链路可观测保障业务稳定 : 小鹏基于托管在 ACK 上的全量业务, 采用 ARMS Prometheus 服务、 前端监控和 APM 等工具实现全链路监控系统, 有效洞察业务稳定性风险, 保障业务稳定性。
统一云原生技术栈简化运维 : 除了通过容器服务 ACK 支持仿真、 音视频转码、 视频截图、 图片处理、数据处理等相关业务外,小鹏还支持 Airflflow/Argo workflflow、Kubeflflow/Arena 等工作流平台。采用统一的技术栈运行各业务及其支撑系统,简化了运维的复杂度。
客户证言
“小鹏汽车和阿里云携手共建自动驾驶智算中心 ‘扶摇’, 为小鹏全场景智能辅助驾驶系统的训练奠定算力基础, 我们相信跟阿里云一起能够更快更好更强的发挥作用。阿里云的技术支持, 使我们的成本降低,在过去及未来的时间里,阿里云的可靠性和稳定性,都是小鹏汽车最好的选择。”
相关产品
1 容器服务 ACK
2 应用实时监控服务 ARMS
3 容器镜像服务 ACR
4 Prometheus 监控服务