GOPS 全球运维大会来了,龙蜥社区邀您一起了解“系统运维”

简介: 4 月 8 日(本周六) 11 点,龙蜥社区开发者在可观测性技术实践专场等你。

GOPS 全球运维大会由高效运维社区(GreatOPS)、开放运维联盟(OOPSA)和 DevOps 时代社区联合主办,指导单位为云计算开源产业联盟、FinOps 产业推进方阵。全球运维大会是国内第一个运维行业大会,面向互联网、金融、通信及传统行业广大运维技术人员,旨在传播先进技术思想和理念,分享业内最佳实践。龙蜥社区核心开发者冯富秋受邀参会,将在“可观测专场”分享技术演讲

13.png

迄今为止,GOPS 已经举行了十九次,第二十届 GOPS 全球运维大会将于 2023 年 4 月 7-8 日在南山区深圳湾万丽酒店召开。大会将为期 2 天,侧重方向是云原生、DevOps、AIOps、DevSecOps、BizDevOps 等技术领域。本次大会特设了如互联网大厂企业专场、银行/证券名企数字化转型案例专场、云原生架构专场、DevOps/AIOps 最佳实践专场、可观测性技术实践专场等特色专场。


大会演讲嘉宾简介:

演讲主题:阿里基于内核剖析的故障分析和智能运维实践

演讲时间:4 月 8 日 11:30-12:10

演讲嘉宾:冯富秋,龙蜥社区系统运维 SIG Owner

主题简介:

云应用复杂的问题单纯从应用自身或内核的已有指标难以定位,因此都需要深入内核分析。但内核故障的诊断和运维本身具有较高复杂度,也要求运维人员具备较高的技术门槛和经验积累。当前,业界具备这部分能力的人才严重不足。从调查发现,大量中小客户都只能放任故障发生,因此亟需自动化和智能化的内核诊断和运维系统赋能客户,以减小故障诊断和运维的难度。作为阿里巴巴操作系统部门系统服务团队,我们提供全集团内核故障的诊断分析和修复服务,并对阿里云内核疑难问题提供兜底服务。我们基于历史处理过的所有内核故障做系统性梳理和总结,通过阿里云大量的运维经验,进行深度内核的运维探索并贡献到龙蜥社区。

演讲内容:

1、运维的现状和挑战 2、更好的运维体验 3、SysOM 2.0 功能分享

听众益: 

1.向你展示传统开源监控和定位手段在实际大规模真实场景下的不足和困境,了解运维同学心里的痛。

2.了解龙蜥社区 SysOM 运维系统如何基于内核的深度定制,让问题不仅知其然,还知其所以然。

GOPS 主要面向运维行业的中高端技术人员,包括运维、开发、测试、架构师等群体。目的在于帮助 IT 技术从业者系统学习了解相关知识体系,让创新技术推动社会进步。您将会看到国内外知名企业的相关技术案例,也能与国内顶尖的技术专家探讨技术实践,使企业可以根据最佳实践确定自己的选型方案,并提前预估相关的风险和收益,实现技术落地。欢迎大家来观看此次的技术分享,4 月 8 日 11:30 见~

活动议程详情链接:

https://www.bagevent.com/event/8373986?bag_track=WS&code=001ISz1w3gfUo03EH82w3KdsRM0ISz1o&state=STATE

相关文章
|
25天前
|
运维 Linux Apache
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
48 3
|
1月前
|
运维 监控 安全
高效运维管理:提升系统稳定性的策略与实践
【10月更文挑战第2天】 在当今数字化时代,运维管理成为企业IT部门的重要任务。本文将探讨如何通过高效的运维管理策略和最佳实践,提升系统的稳定性,确保业务持续平稳运行。通过分析常见问题、预防措施以及应对策略,我们将揭示高效运维的关键要素,助您打造一个可靠的IT环境。
|
8天前
|
机器学习/深度学习 人工智能 运维
智能运维:AIOps在大型系统运维中的实践与挑战
【10月更文挑战第28天】随着云计算、大数据和人工智能的发展,AIOps(人工智能运维)应运而生,旨在通过算法和机器学习提高运维效率和质量。本文探讨了AIOps在大型系统运维中的实践与挑战,包括数据质量、模型选择和团队协作等方面,并通过一个异常检测案例展示了其应用。尽管面临挑战,AIOps仍有望成为未来运维的重要方向。
34 5
|
8天前
|
运维 监控 中间件
数据中心运维监控系统产品价值与优势
华汇数据运维监控系统面向IT基础架构及IT支撑平台的监控和运维管理,包含监测、分析、展现和告警。监控范围涵盖了网络设备、主机系统、数据库、中间件和应用软件等。
28 4
|
22天前
|
运维 监控 安全
高效运维管理:提升系统稳定性的策略与实践
【10月更文挑战第13天】 本文探讨了高效运维管理的关键策略和实践,旨在帮助运维团队提升系统的稳定性。通过分析常见问题,提出具体的解决方案,包括监控与告警、自动化工具的应用、故障排查与恢复、性能优化以及安全防护等方面。通过这些策略和实践,可以帮助企业构建一个稳定、可靠且高效的IT系统。
62 1
|
4天前
|
运维 监控 网络协议
自动化运维的魔法——打造高效、可靠的系统
【10月更文挑战第32天】在数字化时代的浪潮下,运维不再是简单的硬件维护和故障排除。它已经演变成一场关乎效率、稳定性和创新的技术革命。自动化运维,作为这场革命的核心,正引领着企业走向更加智能和高效的未来。本文将带你探索自动化运维的世界,揭示其背后的原理和实践,让你领略到自动化带来的无限可能。
10 0
|
1月前
|
运维 监控 安全
构建高效运维体系:从监控到自动化的全面指南在当今数字化时代,运维作为保障系统稳定性和效率的重要环节,其重要性不言而喻。本文将深入探讨如何构建一个高效的运维体系,从监控系统的搭建到自动化运维的实施,旨在为读者提供一套完整的解决方案。
本文详细介绍了高效运维体系的构建过程,包括监控系统的选择与部署、日志分析的方法、性能优化的策略以及自动化运维工具的应用。通过对这些关键环节的深入剖析,帮助运维人员提升系统的可靠性和响应速度,降低人工干预成本,实现业务的快速发展和稳定运行。
|
1月前
|
运维 Prometheus 监控
运维中的自动化实践每月一次的系统维护曾经是许多企业的噩梦。不仅因为停机时间长,更因为手动操作容易出错。然而,随着自动化工具的引入,这一切正在悄然改变。本文将探讨自动化在IT运维中的重要性及其具体应用。
在当今信息技术飞速发展的时代,企业对系统的稳定性和效率要求越来越高。传统的手动运维方式已经无法满足现代企业的需求。自动化技术的引入不仅提高了运维效率,还显著降低了出错风险。本文通过几个实际案例,展示了自动化在IT运维中的具体应用,包括自动化部署、监控告警和故障排除等方面,旨在为读者提供一些实用的参考。
|
2月前
|
机器学习/深度学习 人工智能 运维
|
1月前
|
运维 监控 大数据
高效运维管理:提升系统稳定性的策略与实践
在当今信息技术飞速发展的时代,运维管理作为保障系统稳定运行的关键环节,其重要性不言而喻。本文将深入探讨如何通过优化运维流程、引入自动化工具和建立完善的监控体系等策略,来有效提升系统的稳定性。同时,结合具体实践案例,分析这些策略在实际工作中的应用效果,为运维人员提供有益的参考和启示。
73 6
下一篇
无影云桌面