在今年5月的Google IO开发者大会上,Google隆重介绍了其一款黑科技产品的功能升级——Google助手(Google Assistant),能够像真人一样通过电话为主人预约生活服务。在演示视频中,Google助手致电理发店和餐馆,像真人一样经过多轮沟通后顺利完成预约任务,而通话对方完全没有发觉自己是在和一个软件对话。如果你对人工智能话题有所关注,你应该知道「图灵测试」:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有人工智能。而从视频来看,Google助手显然已经达到了这个标准。
Google Assistant先拨通了Jim理发店的电话,进行电话预约剪发
如果你还没意识到什么,让我们继续来举例:Google旗下DeepMind公司制造的Alpha Go从2015年开始,在短短两年间击败多名围棋职业棋手,在世界职业围棋等级分排行网站Go Ratings上一度排名世界第一,并且最终在2017年以3:0击败了当时已蝉联三年世界第一的棋手柯洁。
Gartner在上个月发布报告《Lessons Learned From Chinese Companies’ AI Projects》(中国企业的AI项目带来的启示)中预测,到2022年,中国开发的B2C和B2B2C应用中有40%将包括人工智能技术。通过对宝尊电商、东方航空、兴业银行、特曲农业和徐工机械五个不同行业的AI项目进行深入研究,Gartner发现企业对于AI技术应用的主要动机有两点:提高效率及降低成本。这些AI项目非“概念”与“实验”,而是已经真正投产到生产系统之中,在各自的企业中发挥了价值,并且带来了相应的数字效益。
从科幻小说到现实生活,AI已经无可避免地进入生产可用阶段,确实已替代人力去解决问题。
由此不禁想起霍金曾预言,人工智能可能会发展到非常强大的程度,可能取代人类,甚至在完全无意的情况下毁灭人类。那么,从事IT工作的你是否也曾担心:AIOps的未来是否会取代运维人员?
AI与Ops
早在2016年,Gartner就已经提出了AIOps的概念并宣称,到2020年,将近50%的企业将会在他们的业务和IT运维方面采用AIOps,远远高于今天的10%。理解AI与Ops的关系,不如从Gartner的理解入手。
AIOps在Gartner的词库中是AlgorithmicIT Operations的缩写,字面的解释是一种基于AI算法的运维方式,Gartner在今年发布的《Market Guide for AIOps Platforms》报告中为AIOps作出如下定义:AIOps平台是结合大数据、人工智能(AI)或机器学习功能的软件系统,用以增强和部分取代广泛应用的现有IT运维流程和事务,包括可用性和性能监控、事件关联和分析,IT服务管理以及运维自动化。简而言之,AI是不需要人工干预,就能帮助运维人员提高生产力的一种途径。未来,AI是否可以完全取代人类思考,还未可知,但至少在目前看来,这种美好的预期还必须人的智慧去创造。
另一方面,当越来越多的业务系统、新技术应用承载于IT系统之上,IT系统作为基础设施也迅速拓建和创新: 从过去的物理机,到虚拟化技术带来的虚拟机运载,到当下正热的LXC软件容器,公有云和私有云的应用,运维监控对象的数量和监控难度都呈指数级增长。
天旦一直致力于通过旁路方式实现实时、全量、精准的的业务性能监控,当一次在与国外用户的交流沟通汇总发现,在云环境下,尤其大部分的公有云几乎都不提供获取流量的端口,租户无法突破其封闭式的底层架构而获得详细的业务过程数据。一方面,这让业务的性能变化过程“两眼一抹黑”,无从即刻知晓;另一方面,一旦业务在非人为的情况下产生迁移,就会逃出运维人员的监控视野。随着云计算的普及,这将是广泛存在的运维盲区。天旦研发人员基于SDPM(Software Define Performance Management)思维,应用历年来互联数据引擎的核心算法积累而开发了一款开源的镜像工具,Packet Agent。
Packet-Agent端口镜像工具,旨在帮助用户解决在云环境、虚拟机等复杂环境下无法实时获取完整业务过程数据,感知业务变化的问题,而不需要网络镜像的硬件设备,可适用于Linux,Unix,Mac, Windows等各种操作系统。与PacketBeat、Splunk App for Stream等工具比较,天旦Packet Agent大大节省了机器开销,并且实现了自定义化的协议支持,甚至直接导出数据包(另2种工具尚且无法实现)等功能。(关注天旦公众号“天旦Netis”,输入“镜像”,免费获取Packet-Agent端口镜像工具)
天旦认为,技术的问题,应当交给技术来解决。用AIOps去解决运维中的问题,释放运维的潜力,给予运维人更多的时间去集中思考,找到合适的方法去攻克下一个难题。
AIOps,走出“有多少人,就有多少智能”的 怪圈
Gartner在《Market Guide for AIOps Platforms》报告中指出: 过去三年,IT 运营部门分别部署了大数据和机器学习技术,以支持IT运营的监控。然而,在过去的6个月里,企业已经开始将面向IT运营的大数据和机器学习项目相结合,并将其扩展到服务台和自动化。企业在IT运营(AIOps)平台上使用人工智能来增强并取代传统的应用性能监控(APM)和网络性能监控与诊断(NPMD)工具。
人工智能算法的成长离不开队海量案例的分析和学习,而现在许多所谓AI告警的定制化方案受限于缺乏充足的真实案例,需要在部署后耗费繁重的人工进行后期的调整和维护,原本想要解放劳动力的项目,却成为了耗费人力和时间的黑洞,而且算法效果极不稳定。
天旦作为企业级软件产品公司,通过提供通用性的产品而非定制化的解决方案,使得智能算法真正成熟产品化。多年来,陪伴120+家银行经历数字化转型的整个过程,每天保障超过200亿笔交易的稳定运行,积累了极其丰富的案例资源与经验,为算法的不断完善提供扎实的依据,并转而进一步将成熟的智能化技术应用到产品功能的之中。
天旦业务性能管理BPC,通过算法升级集合智能发现、智能梳理、智能告警、智能预测、智能排障五大模块,使得运维人员只需简单配置全面覆盖的告警规则,结合自动故障定位和自动故障域分析,加速故障发现和分析流程,缩短故障恢复时间。
智能发现:5年自研专利解码引擎,自动发现应用访问关系,自动解析业务数据内容。
智能梳理:通过天旦BPC的核心组件——服务路径图发现,自动梳理业务访问关系,呈现以服务为中心的拓扑视图,让数以月计的业务梳理工作突破性地缩短到天。
智能告警:将告警场景归纳为五大类型,几乎涵盖所有常见的高频故障场景。运维人员仅需选择合适的告警场景,智能告警算法将自动匹配与之对应的告警逻辑,大大提高告警的配置效率。
智能预测:实时监控,智能算法自动根据历史表现绘制基线,直观发现变化趋势。
智能排障:自动定位故障节点,一键解析造成故障发生的维度和指标,无需专家介入。
正所谓“科学技术是第一生产力”。天旦相信,随着智能化运维技术的不断演进,AIOps脱离人力干预而自动处理运维问题的能力一定会得以实现。
未来:源于「人」
尽管Google助手可以帮助主人像真人一般沟通交流,但无法代替主人决心的每日行程;尽管自动驾驶技术可以如真人驾驶一般控制汽车,但无法代替人决定出行的意愿。AI的使命在于为人类解决问题,而非控制或取代人类。
李开复在TED 2018年度大会上发表演讲说,工业革命把手工工匠的工作转化成大量常规工作(如生产线工作),但是人工智能革命将彻底取代这些生产线工作。不出十五年,驾驶、电话销售、卡车司机甚至是放射科医生等类似工作和事务也将被人工智能取而代之。在这场人工智能摧毁工作的浩劫中,唯有创造性工作才能从中全身而退。在所有重复性工作上,人工智能都将高出人类一筹。但我们并非因为擅长重复性工作而为人。
天旦相信,随着数字化转型的深入,AIOps必将成为运维组织高效运作的关键所在。运维过程中琐碎、重复的工作终将被由智能化的工具所替代,但却无法磨灭运维人的存在使命:基于运维系统的深刻理解,做智能化运维的指挥官,谋略布局。而天旦也将继续精进算法、积累行业经验,将智能化的技术植根于产品研发与功能设计的细节之中,帮助“运维指挥官”释放运维的智慧潜力,为企业在数字化转型之路上创造更多业务可能。
原文发布时间为:2018-09-13
本文作者:Netis天旦