自动化运维软件的模式变化有哪些

简介:

为什么说自动化运维软件更适合采用开源的“集市”模式构建?

新旧两代自动化软件的渊源

传统运维自动化软件以Opsware(后来变成HP Opsware)和bladelogic(后来变成了BMC bladelogic)为代表,畅销书《创业维艰》讲的就是Opsware的经历,属于典型的大教堂模式;新一代运维自动化软件则是以开源软件 Puppet,chef,ansible等为代表,属于典型的集市模式。有趣的是,Puppet创始人Luke, 2007年在bladeLogic干过7个月产品经理。可以说这两类自动化软件之间有很深的渊源,甚至在核心技术实现上都有很多雷同之处。

PUPPET的成长经验

朋友中有几位在Opsware工作过,我自己也曾经在BMC工作过,目前又和Puppet深度合作,对这几家基本上都有一点感官认知。这次美国之行,发现2011年刚开始商业化运作的Puppet,在2015年就能做到$100M(1亿美金)的营收,而且内部人还抱怨说销售做的不好,换了COO至少要翻倍才行,实实在在被惊到了。

如果不是理解错了印式英语,那就是时代真的变了。所以,又看了一遍开源软件圣经《大教堂与集市》,忍不住又要胡言乱语了。

先说为什么吃惊,从传统商业角度来对比集市里长大的Puppet和教堂里的Opsware、bladelogic,简直没法进行下去。比如,Puppet的web界面看起来就不像个正经系统,一点吸引力都没有;功能上,连可编排的流程引擎都没有,这在销售阶段怎么讲啊……除了稳定的agent和开放的抽象定义语言,没法比下去啊,哪儿来的这$100M 的营收啊?

怎么可能,于是带着批判的态度,找些别的数字看看,直到看了:

30000+公司在使用、平均每天增加21个

3800+可复用的自动化管理模块

基本上有点平复,可以思考下去了。

首先,puppet的成长经验,印证了《大教堂与集市》里的诸多观点。puppet既满足开源的5个前提,也符合开源的模式发展特征,不一一列举了,都很贴切。更多的感悟是:结合业务领域的特性,自动化管理软件本身是更适合集市模式的。

首先,自动化事关运行环境安全,架构必须异常稳定,尤其是agent和接口层,直插生产系统,一旦有失,无法想象。

怎么能稳定呢?单靠一个天才灵光一闪,啪啪啪敲几行代码,是很难做到的。必须靠足够多的环境和场景验证,才能逐步成熟,这30000+的客户(包括百分之六十以上的财富500强公司),才带来puppetagent的公信力。靠传统模式,一家一家卖进去,再用起来,想不到结果。(Q:现在还在坚持自己开发agent的逻辑是什么?)

更重要的是,自动化管理对象和场景千差万别,几乎不可穷举,每个管理员遇到的环境和问题可能都不一样,如何满足个性化需求。显然,问题是如何根据环境和功能场景,构建一个持续更新的管理实践库(场景用例,配置模板,动作脚本,固化流程,接口实现等等),既继承了前人和大众通用的经验总结,又满足个性化需求。

答案可能只在集市里,汇聚足够多的合格的用户,来“共创、共建、共享、共赢”。

在工具层面降低扩展成本和使用门槛是前提,让更多的人有生产能力,这是puppet抽象定义语言解决的问题。

不断被建立并成熟起来的管理标准

花精力建立生态是关键,汇总下来广大用户积累的通用经验,去粗取精,去伪存真,把控质量,将可靠的模块毫无保留的连源码一块儿发布出去,供用户选择,并再在这基础之上定制满足个性化需求,当个性化需求再次被汇总,又能积累出新的共性经验,循环往复,不断成熟,所谓的管理标准就这样慢慢产生了。

没有太多积累和技术实力的用户,就可以直接开箱即用的向这些标准积累靠拢,述而不作。这是模块仓库forge解决的问题,这3800+的现成管理模块就是时间的积累。反过来,传统模式采取的运维知识库,靠一个组织独立生产和维护,基本上没法保证更新速度、覆盖范围和质量。

另一方面,当生态圈足够大时,成为事实的标准,汇聚的就不止是用户的力量了,周边组织,像设备提供商,系统提供商,软件提供商,资源提供商,服务提供商,都会选择从生产和设计阶段一开始就遵从这个标准,不用自己费心费力去发明私有框架了。可以在社区里看到很多顶级厂商主动适配,我们国内的H记大厂就将在新的设备里内置puppet代理(即将发布)。

最后,还有一点颇为精妙的个人体会。也挺符合古书里的陈述,是关于对用户的筛选,如何取得足够多的“合格用户”。传统商用软件因为其销售使命,会尽量满足用户喜好,尽量不让用户努力,除了核心组件,各种辅助功能都做到产品化,甚至有时候对销售来说,辅助功能比核心功能还重要。达成效果是,用户觉得反正又不用做什么,又能买到一堆功能,不管是不是真要用,买了吧。而puppet这种开源软件,是只关注核心刚需的,周边配套一塌糊涂,我有时候觉得它是故意的,这样选择了puppet的用户,必须要自己研究怎么使用,没有刚需推动,也没人搞这个。所以,也反向淘汰了一批不那么合格的用户。这也符合互联网思维中“少即是多”的理念(臆想的谋略)。

有了这些刚性资本,还谈什么商业模式,企业版解决方案加企业版软件,技术支持,顾问服务,培训认证……满眼都是模式。越说越多,好像没法说完,所以干脆不说了,$100M的事儿,个人基本被说服了。

所以忍不住分享出来,自动化软件的平台特性十分明确,开源的集市模式已经在改变游戏规则。自动化运维的未来已来,与诸君共勉!





作者:杨超
来源:51CTO
目录
相关文章
|
2月前
|
测试技术 开发者 Python
自动化测试之美:从零构建你的软件质量防线
【10月更文挑战第34天】在数字化时代的浪潮中,软件成为我们生活和工作不可或缺的一部分。然而,随着软件复杂性的增加,如何保证其质量和稳定性成为开发者面临的一大挑战。自动化测试,作为现代软件开发过程中的关键实践,不仅提高了测试效率,还确保了软件产品的质量。本文将深入浅出地介绍自动化测试的概念、重要性以及实施步骤,带领读者从零基础开始,一步步构建起属于自己的软件质量防线。通过具体实例,我们将探索如何有效地设计和执行自动化测试脚本,最终实现软件开发流程的优化和产品质量的提升。无论你是软件开发新手,还是希望提高项目质量的资深开发者,这篇文章都将为你提供宝贵的指导和启示。
|
3月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
70 4
|
23天前
|
缓存 监控 安全
公司电脑监控软件的 Gradle 构建自动化优势
在数字化办公环境中,公司电脑监控软件面临代码更新频繁、依赖管理和构建复杂等挑战。Gradle 构建自动化工具以其强大的依赖管理、灵活的构建脚本定制及高效的构建缓存与增量构建特性,显著提升了软件开发效率和质量,支持软件的持续更新与优化,满足企业对员工电脑使用情况的监控与管理需求。
35 3
|
1月前
|
运维 jenkins Java
Jenkins 自动化局域网管控软件构建与部署流程
在企业局域网管理中,Jenkins 作为自动化工具,通过配置源码管理、构建及部署步骤,实现了高效、稳定的软件开发与部署流程,显著提升局域网管控软件的开发与运维效率。
41 5
|
2月前
|
机器学习/深度学习 运维 监控
智能化运维:从自动化到AIOps的演进之路####
本文深入探讨了IT运维领域如何由传统手工操作逐步迈向高度自动化,并进一步向智能化运维(AIOps)转型的过程。不同于常规摘要仅概述内容要点,本摘要将直接引入一个核心观点:随着云计算、大数据及人工智能技术的飞速发展,智能化运维已成为提升企业IT系统稳定性与效率的关键驱动力。文章详细阐述了自动化工具的应用现状、面临的挑战以及AIOps如何通过预测性分析和智能决策支持,实现运维工作的质变,引领读者思考未来运维模式的发展趋势。 ####
|
2月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的崛起背景,深入分析了其核心概念、关键技术、应用场景及面临的挑战,并对比了传统IT运维模式,揭示了AIOps如何引领运维管理向更高效、智能的方向迈进。通过实际案例分析,展示了AIOps在不同行业中的应用成效,为读者提供了对未来智能运维趋势的洞察与思考。 ####
97 1
|
2月前
|
测试技术 持续交付
探索自动化测试在软件质量保证中的关键作用
本文深入探讨了自动化测试在现代软件开发生命周期中的重要性,以及它是如何成为确保软件产品质量的不可或缺的一环。通过分析自动化测试的优势、挑战和最佳实践,本文旨在为读者提供对自动化测试全面而深刻的理解,从而帮助他们在实际工作中更有效地应用自动化测试策略。
36 2
|
2月前
|
jenkins 测试技术 持续交付
自动化测试框架的构建与优化:提升软件交付效率的关键####
本文深入探讨了自动化测试框架的核心价值,通过对比传统手工测试方法的局限性,揭示了自动化测试在现代软件开发生命周期中的重要性。不同于常规摘要仅概述内容,本部分强调了自动化测试如何显著提高测试覆盖率、缩短测试周期、降低人力成本,并促进持续集成/持续部署(CI/CD)流程的实施,最终实现软件质量和开发效率的双重飞跃。通过具体案例分析,展示了从零开始构建自动化测试框架的策略与最佳实践,包括选择合适的工具、设计高效的测试用例结构、以及如何进行性能调优等关键步骤。此外,还讨论了在实施过程中可能遇到的挑战及应对策略,为读者提供了一套可操作的优化指南。 ####
|
2月前
|
机器学习/深度学习 数据采集 人工智能
智能运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的兴起背景、核心组件及其在现代IT运维中的应用。通过对比传统运维模式,阐述了AIOps如何利用机器学习、大数据分析等技术,实现故障预测、根因分析、自动化修复等功能,从而提升系统稳定性和运维效率。文章还深入分析了实施AIOps面临的挑战与解决方案,并展望了其未来发展趋势。 ####
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
自动化测试的新篇章:利用AI提升软件质量
【10月更文挑战第35天】在软件开发的海洋中,自动化测试犹如一艘救生艇,它帮助团队确保产品质量,同时减少人为错误。本文将探索如何通过集成人工智能(AI)技术,使自动化测试更加智能化,从而提升软件测试的效率和准确性。我们将从AI在测试用例生成、测试执行和结果分析中的应用出发,深入讨论AI如何重塑软件测试领域,并配以实际代码示例来说明这些概念。
72 3