SREWorks云原生数智运维工程实践-导语

简介: SREWorks云原生数智运维工程实践-

本书会教读者如何利用SREWorks开源数智运维平台,来构建满足业务需求的数智运维体系。本书不会有太多手把手的直接教学内容,更多的是告诉读者如何去整理当前的技术栈,才能进一步向数智运维演进;让读者了解到云原生下的运维体系能够为企业带来什么样的实际价值。

 

孵化SREWorks的开发团队也是一支大数据基础工程技术团队,他们将数据化运维、智能化运维引入到运维体系中。以监控为例,监控不仅仅是agent采集上报就结束了,将数据通过ETL抽取Extract/转换Transform/加载Load处理成各种结构的数据,通过智能算法或者规则对其进行分析,最后将分析结果变化成可以直接执行的自动化指令,实现数智运维才是一个完整的闭环。想要了解数智运维体系以及平台架构,推荐阅读《SREWorks介绍篇》。

 

云原生的架构不仅仅是工作负载从进程变成容器Container继而变成Pod这么简单,很多原本在虚拟机内实现的调度逻辑被释放到了k8s的控制平面,这一改变增加了容器编排的复杂度,但也进一步提升云原生架构的通用性和灵活性。SREWorks运维开发团队凭借在大数据大规模集群的丰富运维开发经验,在云原生场景下快速迭代演进,实现了数智运维方案云原生化。如果希望了解云原生技术栈如何演进的同学推荐阅读《Kubernetes资源编排篇》。

 

众所周知,单集群5000个节点曾是集群规模化的一个门槛,在这个体量下很多技术方案都会出现从量变到质变的飞跃。阿里飞天集群在2013年就达到了5K的规模,而孵化SREWorks的团队正是支撑这个5K集群背后的运维团队。团队里自行研发的无数个运维工具撑起了飞天5K集群的一次次的升级、扩容以及变更。也是这些历练,让这些工具快速成长为各种面向海量机器、规模集群的平台化运维方案:从交付到监测,从管理到运营,所有相关的能力一应俱全。想要知晓这些平台化的能力如何在生产环境中大显身手,推荐阅读《云原生运维实战篇》。

 

本书适合正在向云原生转型的技术老兵,也适合刚入行正在熟悉k8s的小白。推荐阅读完本书后配合SREWorks进行实践,效果更佳。

相关文章
|
6月前
|
运维 监控 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
国诚投顾携手阿里云,依托Serverless架构实现技术全面升级,构建高弹性、智能化技术底座,提升业务稳定性与运行效率。通过云原生API网关、微服务治理与智能监控,实现流量精细化管理与系统可观测性增强,打造安全、敏捷的智能投顾平台,助力行业数字化变革。
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
|
6月前
|
运维 监控 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
通过与阿里云深度合作,国诚投顾完成了从传统 ECS 架构向云原生 Serverless 架构的全面转型。新的技术架构不仅解决了原有系统在稳定性、弹性、运维效率等方面的痛点,还在成本控制、API 治理、可观测性、DevOps 自动化等方面实现了全方位升级。
|
4月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
309 7
|
6月前
|
弹性计算 运维 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生Serverless实践
简介: 通过与阿里云深度合作,国诚投顾完成了从传统 ECS 架构向云原生 Serverless 架构的全面转型。新的技术架构不仅解决了原有系统在稳定性、弹性、运维效率等方面的痛点,还在成本控制、API 治理、可观测性、DevOps 自动化等方面实现了全方位升级。
178 1
|
5月前
|
存储 弹性计算 Cloud Native
云原生数据库的演进与应用实践
随着企业业务扩展,传统数据库难以应对高并发与弹性需求。云原生数据库应运而生,具备计算存储分离、弹性伸缩、高可用等核心特性,广泛应用于电商、金融、物联网等场景。阿里云PolarDB、Lindorm等产品已形成完善生态,助力企业高效处理数据。未来,AI驱动、Serverless与多云兼容将推动其进一步发展。
271 8
|
6月前
|
运维 Dubbo Cloud Native
Dubbo 云原生重构出击:更快部署、更强控制台、更智能运维
Apache Dubbo 最新升级支持云原生,提供一键部署微服务集群与全新可视化控制台,提升全生命周期管理体验,助力企业高效构建云原生应用。
605 25
|
7月前
|
Cloud Native 中间件 调度
云原生信息提取系统:容器化流程与CI/CD集成实践
本文介绍如何通过工程化手段解决数据提取任务中的稳定性与部署难题。结合 Scrapy、Docker、代理中间件与 CI/CD 工具,构建可自动运行、持续迭代的云原生信息提取系统,实现结构化数据采集与标准化交付。
372 1
云原生信息提取系统:容器化流程与CI/CD集成实践
|
6月前
|
运维 Kubernetes Cloud Native
云原生运维也能很稳:Kubernetes 运维避坑指南
云原生运维也能很稳:Kubernetes 运维避坑指南
222 1
|
7月前
|
运维 监控 Cloud Native
从“守机器”到“写策略”——云原生架构把运维逼成了架构师
从“守机器”到“写策略”——云原生架构把运维逼成了架构师
186 1
|
7月前
|
运维 Kubernetes Cloud Native
分钟级到秒级:Yahaha 基于 OpenKruiseGame 的 UE5 游戏云原生实践
回顾《STRIDEN》项目在短短两个月内完成云原生转型的历程,它验证了一条清晰、可行的路径,即如何利用云原生技术,从根本上解决现代在线游戏所面临的运维复杂性难题。

热门文章

最新文章