5.9.2 SysOM :一站式运维管理平台
概述
SysOM( System Operation & Maintenance)是由龙蜥社区系统运维SIG打造的一站式操作系统运维平台,致力于解决业内相关运 维工具碎片化,门槛高的挑战。
技术方案 SySOM的整体架构分为前端、服务端、客户端三部分,其系统架构图如下所示:
SysOM打通了系统监控、告警、诊断以及安全运维的全流程。基于SysAK入的内核行为分析,服务端的大数据和器学习分析,不仅能让运维人员发现问题,还能非常精确的定位到问题的故障点,从而实现“傻瓜式”的运维体验。整体平台具备以下特点:
统一平台:一个平台解决操作系统运维过程中所需要的多种关键能力。SysOM将主机管理、监控、诊断、审计、修复、安全能力集于一体,核心的功能采用模块化设计,界面与核心服务分离,方便客户的二次集成。
简单易用:降低运维的门槛,解决常规操作系统监控各类专业看板和告警无法与用户自身编写的代码关联的核心痛点。让用户清楚引发问题的自身代码缺陷点或系统具体问题配置。
深度分析:集成SysAK工具集深度诊断解决方案,沉淀百万级的运维经验,进行内核源码级别的问题剖析。让每一个应用的行为都“知其所以然”。
安全可靠:提供统一的安全中心,为用户所管理主机提供全方位的漏洞监控、管理、修复,保障系统的安全性;同时提供各类安全加固能力,满足不同应用不同程度的安全要求。
应用场景
SysOM采用微服务、前后端分析的技术架构, 针对不同集群规模的应用场景,提供灵活的集成方案。
小规模集群应用:一站式简易集中部署,覆盖主机管理、堡垒机、监控、诊断以及安全运维等全流程方案。
大规模集群应用:各服务模块使用独立docker部署,弹性扩容。接入标准的Kafka/Flink大数据框架。满足大规模的流量冲击。
集成到现有系统:对于已有运维系统的用户,用户可以抛弃SysOM前端,使用规范的后端接口, 接入SysOM功能。 SysOM已经为这类用户专项考虑,降低对接成本。