GOPS 全球运维大会 | 阿里云网络自动化运维体系落地实践分享

本文涉及的产品
云网管,50台设备规模 3个月
简介: GOPS 全球运维大会 | 阿里云网络自动化运维体系落地实践分享

首图-图标.png


【阅读原文】戳:GOPS 全球运维大会 | 阿里云网络自动化运维体系落地实践分享



10月28日-29日,第十八届GOPS全球运维大会GOPS 2022在上海顺利召开。作为国内规模最大的高端运维盛会之一,大会涵盖了DevOps、AIOps、DevSecOps、云原生、效能度量等多个技术领域,此外还特设了自动化运维、云原生及DevOps 实践等特色专场。阿里云基础设施网络团队资深技术专家林涛受邀分享阿里云基础设施网络在自动化运维体系方面的落地实践


B4B749E6-3FBC-4042-B364-9E0521A50CE3.png

GOPS全球运维大会由高效运维社区(GreatOPS)、开放运维联盟(OOPSA)和 DevOps时代社区联合主办,是国内第一个面向互联网、金融、通信及传统行业广大运维技术人员的运维行业大会,旨在传播先进技术思想和理念,分享业内最佳实践。


全球运维大会 林涛1.jpg

图|阿里云基础设施网络团队资深技术专家林涛分享阿里云基础设施网络在自动化运维体系方面的落地实践


林涛回顾了阿里巴巴网络基础设施的超大规模发展历史。阿里云网络基础设施设备规模数的飞速增长使得网络架构异常复杂,同时给系统的稳定性等带来了很大挑战。面对诸多运维困难,阿里云基础设施网络自动化团队自主研发了覆盖网络运维全生命周期的网络自动化运维系统,涵盖资产管理、网络架构规划、交付、变更、监控、运营等主要能力,通过制定完善的运维体系并沉淀成系统能力,极大地提高了基础设施网络的稳定性。


林涛在分享中还强调:网络自动运维体系搭建带来的不仅是系统稳定性的提高,通过系统来实现自动化运维、智能运维,还能极大地提高运维效率。阿里巴巴基础设施在规模化增长的过程中,网络自动化团队人员的投入并没有同步增加,为公司带来了非常好的降本提效效益。在实际运维工作中,运维同学还能将自己的运维经验沉淀成系统的标准运维方案,极大地提高了整个团队的运维水准和效率。


运维大会.jpg


历经打磨,阿里云基础设施网络团队已成功将积累多年建设成熟的网络自动化运维系统产品化输出到阿里云平台,形成了标准的商业化产品——云网管CMN。产品面向所有公共云、专有云等客户开放,适用于数据中心运维、办公网运维、连锁分支门店网络运维、场馆展会网络运维等业务场景。


阿里云“云网管”产品主要包括设备资产管理、网络建设规划、设备监控告警、SYSLOG日志、流量分析、网络拓扑可视化、网络自动化、巡检等主要能力,在不通厂商、不同型号设备纳管方面具有独特优势,支持市面上主流厂家服务器、网络设备、防火墙、无线AP、IOT终端等的统一管理监控运维。产品开箱即用,安装探针后可自动发现网络中设备并一键纳入管理,功能操作简单方便易用,产品功能提供API可方便与第三方业务系统集成。


当前大型企业IT架构复杂,在本地建有数据中心的同时,可能也在同时使用各类公共云厂商的服务。阿里云“云网管”除了能对客户自建数据中心进行管理外,还能统一监管各类公共云上资源,为客户提供多云与线下数据中心的统一融合监管控运维方案。


展望未来,阿里云基础设施网络团队将结合自身优势,携手业内硬件生态厂商伙伴,持续加强产品异构设备、云上资源统一监管控能力,聚焦智能化运维体系标准建设及产品化,为推动IT基础设施朝智能化方向演进不断贡献力量!



点击 此处 了解更多“阿里云云网管”产品



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。


相关文章
|
17天前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
|
14天前
|
边缘计算 容灾 网络性能优化
算力流动的基石:边缘网络产品技术升级与实践探索
本文介绍了边缘网络产品技术的升级与实践探索,由阿里云专家分享。内容涵盖三大方面:1) 云编一体的混合组网方案,通过边缘节点实现广泛覆盖和高效连接;2) 基于边缘基础设施特点构建一网多态的边缘网络平台,提供多种业务形态的统一技术支持;3) 以软硬一体的边缘网关技术实现多类型业务网络平面统一,确保不同网络间的互联互通。边缘网络已实现全球覆盖、差异化连接及云边互联,支持即开即用和云网一体,满足各行业需求。
|
16天前
|
弹性计算 运维 监控
自动化AutoTalk第十一期-应知必会的自动化工具之阿里云配额中心
本次分享主题为“应知必会的自动化工具之阿里云配额中心”,课程围绕三个方面展开:1) 认识配额及其作用;2) 配额管理的意义与方法;3) 阿里云配额中心的功能和使用场景。通过学习,了解如何有效管理和监控配额,避免资源限制影响业务,并实现自动化集成,提升运维效率。
37 10
|
21天前
|
Kubernetes Java 持续交付
小团队 CI/CD 实践:无需运维,Java Web应用的自动化部署
本文介绍如何使用GitHub Actions和阿里云Kubernetes(ACK)实现Java Web应用的自动化部署。通过CI/CD流程,开发人员无需手动处理复杂的运维任务,从而提高效率并减少错误。文中详细讲解了Docker与Kubernetes的概念,并演示了从创建Kubernetes集群、配置容器镜像服务到设置GitHub仓库Secrets及编写GitHub Actions工作流的具体步骤。最终实现了代码提交后自动构建、推送镜像并部署到Kubernetes集群的功能。整个过程不仅简化了部署流程,还确保了应用在不同环境中的稳定运行。
52 9
|
28天前
|
人工智能 自然语言处理 API
阿里云上的IaC和自动化
本文介绍了阿里云上的自动化与基础设施即代码(IaC)的整体情况。阿里云提供了2万多个API,每日调用量达300亿次,同比增长40%。文中探讨了自动化集成的方式,包括通过API、SDK和IaC工具,并分析了不同场景下的选择策略。对于资源管理较少的企业,控制台界面更合适;而对于高频变更和复杂操作,API和IaC是更好的选择。此外,文章还提到了低代码/无代码解决方案及AI在IaC和自动化中的应用前景。
|
2月前
|
运维 供应链 安全
阿里云先知安全沙龙(武汉站) - 网络空间安全中的红蓝对抗实践
网络空间安全中的红蓝对抗场景通过模拟真实的攻防演练,帮助国家关键基础设施单位提升安全水平。具体案例包括快递单位、航空公司、一线城市及智能汽车品牌等,在演练中发现潜在攻击路径,有效识别和防范风险,确保系统稳定运行。演练涵盖情报收集、无差别攻击、针对性打击、稳固据点、横向渗透和控制目标等关键步骤,全面提升防护能力。
|
2月前
|
存储 缓存 运维
阿里云先知安全沙龙(上海站)——后渗透阶段主机关键信息自动化狩猎的实现与应用
本文介绍了在后渗透测试中使用LSTAR工具和PowerShell脚本进行RDP状态查询、端口获取及凭据收集的过程,强调了高强度实战场景下的OPSEC需求。通过MITRE ATT&CK框架的应用,详细阐述了凭证访问、发现和收集等关键技术,确保攻击者能够隐蔽、持续且高效地渗透目标系统,最终获取核心数据或控制权。文中还展示了SharpHunter等工具的自动化实现,进一步提升了操作的安全性和效率。
|
2月前
|
机器学习/深度学习 人工智能 算法
深入解析图神经网络:Graph Transformer的算法基础与工程实践
Graph Transformer是一种结合了Transformer自注意力机制与图神经网络(GNNs)特点的神经网络模型,专为处理图结构数据而设计。它通过改进的数据表示方法、自注意力机制、拉普拉斯位置编码、消息传递与聚合机制等核心技术,实现了对图中节点间关系信息的高效处理及长程依赖关系的捕捉,显著提升了图相关任务的性能。本文详细解析了Graph Transformer的技术原理、实现细节及应用场景,并通过图书推荐系统的实例,展示了其在实际问题解决中的强大能力。
246 30
|
2月前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
|
2月前
|
网络协议 网络安全 Docker
将Certbot/ACME.sh自动化申请的证书自动部署到阿里云CDN
本文介绍了阿里云 CDN SSL 证书自动更新工具,定期检查证书有效期,使用Let's Encrypt 等工具签发的证书自动更新至阿里云 CDN,支持 Docker 及 .NET 8 部署,简化证书管理流程。