随着云计算技术与现代企业技术架构的飞速发展,IT 运维场景愈发多元与复杂,需要观测的对象、观测数据类型、数据规模、数据结构复杂度相较于传统监控发生了翻天覆地的变化。这给企业可观测性的准确、实时、高效与智能化发展带来了巨大挑战。如何借助大模型等智能化技术成为应对云计算可观测性难题的关键工具。
在此背景下,阿里云联合中国信通院及国内头部云厂商、观测厂商、各行业建设方,历时近 5 个月,共同编制《云计算智能化可观测性能力成熟度模型》,以规范和指导云计算环境下的智能可观测性建设实践,为企业实施云环境下的智能化可观测能力建设提供指导。标准于 2024 年 12 月 3 日由全球数字经济大会组委会主办,中国信通院和中国通信企业协会承办的 2024 全球数字经济大会 云·AI·计算国际合作论坛(2024 Cloud AI Compute Ignite)正式发布。
云计算智能化可观测性能力成熟度模型标准
该模型标准适用于可观测大模型、云厂商可观测性平台、可观测独立厂商的各类产品、可观测建设方案等。标准涵盖可观测能力及智能化能力的成熟度模型构建,从全生命周期规范可观测平台的建设和运维,前瞻性提出智能化可观测性的能力建设指引。标准内容涵盖可观测和智能化两大部分,共 6 大能力域,24 个能力项,200 余条能力指标。
“以阿里云可观测产品家族为代表的云原生智能化可观测工具,正引领着可观测加速迈向智能化。企业可以轻松、灵活地构建可观测体系,更高效地管理与观测 IT 资源与服务,为 AI 创新夯实技术底座。”阿里云可观测负责人周琦表示。
在大模型等智能化技术的加持下,阿里云可观测产品不仅为企业提供全新的 IT 资源与服务管理方式,更为 AI 技术发展奠定更坚实的基础。在这个充满机遇与挑战的时代,企业如能灵活运用 AI 可观测技术,不仅能够提升自身的技术水平,更能为未来的商业模式创新打下良好的基础。
据悉,阿里云已为全球 80 余个国家的百万企业级用户提供高效便捷、安全稳定的可观测服务。
- 米哈游基于日志服务 SLS 构建完整业务 & 运维可观测体系;
- 茶百道基于应用实时监控服务 ARMS 快速建立运维观测与响应能力,故障恢复效率提升 50% 以上;
- 传音控股借助 Prometheus、Grafana 等可观测产品,业务上线效率提高 60%;
- 极氪基于日志服务 SLS、应用实时监控服务 ARMS 构建完整监控与应急响应机制,告警平均恢复耗时缩短 50%。