带你读《2022龙蜥社区全景白皮书》——5.9.1 SysAK:大规模复杂场景的系统运维利器

简介: 带你读《2022龙蜥社区全景白皮书》——5.9.1 SysAK:大规模复杂场景的系统运维利器

5.9 运维与性能


5.9.1 SysAK:大规模复杂场景的系统运维利器


概述


SysAK(System Analyse Kit)是龙蜥社区系统运维SIG,通过对过往百万服务器运维经验进行抽象总结,而提供的一个全方位的系 统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。工具的整体设计上,力图让运维工作回 归简单,让系统运维人员不需要深入了解内核就能找出问题的所在。


技术描述


SysAK在功能集上会进行全方位覆盖,垂直打通整个应用的生命周期。当前工具支持监控和诊断两种模式。其中监控模式下SysAK常 驻后台,为运维人员提供系统的各项指标。而诊断模式随用随启,主要用于分析不同运维场景下的系统现象诊断与程序控制等。其 整体功能如下图所示:


image.png


SysAK不仅限于一个工具集,除了提供系统运维工具本身外,还设计实现了一套工具开发框架。并通过松散耦合、依赖管理、多架 构多版本的构建支持等方式,保障了工具开发者,一次开发,无需额外工作,就能在主流的架构和操作系统版本上集成。其整体结 构如下图所示,


image.png


应用场景

SysAK提供的诊断工具可满足不同应用场景的运维需求:

日常监控:针对各种系统资源更精细化的资源监控,帮助业务运维实现细粒度的运维调度和资源控制。除此之外,还实现了许多增

强的系统指标,实时监控系统的干扰和抖动等情况。

问题诊断:针对负载异常、网络抖动、内存泄漏、IO夯、性能异常等情况提供线上诊断功能。 同时减少工具的专业性,可操作性强。

故障修复:对于非整机异常的问题(例如死锁、夯机等), 该工具提供介入能力对系统进行恢复或故障隔离。

相关文章
|
3月前
|
数据采集 运维 数据可视化
AR 运维系统与 MES、EMA、IoT 系统的融合架构与实践
AR运维系统融合IoT、EMA、MES数据,构建“感知-分析-决策-执行”闭环。通过AR终端实现设备数据可视化,实时呈现温度、工单等信息,提升运维效率与生产可靠性。(238字)
|
4月前
|
传感器 边缘计算 运维
AR 虚实叠加技术在工业设备运维中的实现流程方案
AR技术通过虚实信息融合,实现工业设备参数可视化、故障立体化、操作直观化,提升运维效率与精度。结合物联网与数字孪生,打造智能运维新范式。
|
3月前
|
传感器 人工智能 运维
AR智慧运维系统介绍
阿法龙XR云平台是一款面向工业领域的增强现实(AR)智能化平台,助力企业实现数字化转型。平台集成智能巡检工作流、远程协助、AI视频验收、人脸识别等功能模块,支持AR眼镜与移动终端,提供虚实融合的运维体验。具备高度定制化能力,适配多种工业场景,提升运维效率与智能化水平。
|
4月前
|
数据采集 运维 监控
运维靠经验拍脑袋?不如上车:构建“数据驱动”的智能决策系统
运维靠经验拍脑袋?不如上车:构建“数据驱动”的智能决策系统
196 0
|
4月前
|
传感器 人工智能 运维
AR技术电力智慧运维白皮书
AR技术正重塑电力运维模式,通过“端-边-云”协同系统,实现设备可视化、远程协作与智能预警,大幅提升效率与安全性,推动电力行业迈入智能运维新时代。
|
5月前
|
人工智能 运维 监控
聚焦“AI+运维”深度融合,龙蜥系统运维联盟 MeetUp 圆满结束
现场 40 多位开发者进行了深入的技术交流,探索 AI 与运维深度融合的未来路径。
|
6月前
|
人工智能 运维 Prometheus
别等系统“炸了”才慌!聊聊AI搞运维故障检测的那些真香时刻
别等系统“炸了”才慌!聊聊AI搞运维故障检测的那些真香时刻
287 0
|
2月前
|
数据采集 运维 监控
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
本文系统解析爬虫与自动化核心技术,涵盖HTTP请求、数据解析、分布式架构及反爬策略,结合Scrapy、Selenium等框架实战,助力构建高效、稳定、合规的数据采集系统。
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
|
4月前
|
人工智能 运维 Prometheus
运维还要天天盯人值班?现代化运维就该让系统自己跑!
运维还要天天盯人值班?现代化运维就该让系统自己跑!
143 4
|
4月前
|
运维 监控 jenkins
企业服务交付慢?运维技术其实就是“加速器”
企业服务交付慢?运维技术其实就是“加速器”
137 5