首先是 Infrastructure as Code 能力,借助于 IaC 工具和开放的 OpenAPI 可以快速自动化的实现重复部署和部署脚本的版本化管理,尽量使用标准化的策略减少环境差异,同时实现应用交付和操作审计。为了更好的支持自动化,阿里云也构建了类似资源编排、Terrform 等多种形态来编排基础资源。 完成了基础资源和应用交付之后,日常运维主要是对存量资源进行操作。随着越来越多的任务使用自动化模式,运维任务复杂度越来越大,需要将复杂的任务解构,通过组合更多的原子性任务完成运维自动化,越来越多的企业开始使用 Pipeline(Ops) as Code 的能力。通过将执行任务的上下文清晰梳理和可视化依赖关系;让各个 Job 单元原子化,可以高效的完成单元任务并降低单个任务的复杂度;通过任务抽象进行功能的维护和扩展。 除了前面提到的基础设施自动化和基础资源的自动化运维,云平台将大量的资源可编程化,通过 OpenAPI 暴露了大量的其他辅助能力对资源全生命周期管理。但是随着业务系统的复杂度提升,平台需要暴露更多的能力,例如通过事件体系将底层资源的变化实时发送出来,提升透明度;通过监控体系暴露出来更多的 metrics;在应用出现问题之后,通过简单的自助诊断服务可以简化问题发现时间,借助于我们的管控运维通道云助手甚至可以一键修复问题。 弹性能力是云计算的最重要的能力之一,通过超大规模的资源池配置能力,快速实现分钟级的资源需求供给,满足不同规模场景的弹性需求,借助于灵活的弹性能力可以充分的帮助企业降低成本、提升可用性。
答复内容摘自《2021云上架构与运维峰会演讲合集》,这本电子书收录开发者藏经阁 下载连接:https://developer.aliyun.com/topic/download?id=8269
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。