2024年度云治理企业成熟度发展报告解读(四)支柱结构关系及案例分享

简介: 从组织、成本、稳定、安全到性能、效率这样一个路径,我们一定要有策略地完成各个支柱之间的互相配合。云治理不仅仅是技术问题,而是需要多团队合作和管理策略的制定。

在企业IT架构从分布式转向集中式的过程中,职责结构和组织角色的重新定义成为关键挑战。特别是如何平衡稳定性、成本、安全与性能之间的关系,成为企业在云迁移与技术运营中的核心议题。并结合金融行业作为案例,展示了企业在面对云平台投资巨大时,如何通过标准化答案和管理业务结果的承诺,来促进架构改善与成本控制。

以下为发言完整内容:

然后再往下,这里是一个很关键的东西,重点,在整个全网里面是找不到这份观点的,这种观点从去年我们发布到现在也没有看到类似的语言。因为去年发布的时候,我的时间很短,所以我就很快速地跟大家过了,但今天的时间稍微多一点,我想跟大家详细讲一讲,我为什么要跟大家分享这个支柱之间的一些关系。因为我们在走访企业客户的时候,我们的企业客户说,我知道稳定性是什么,不就是把我们的架构做的更可靠一点嘛?不依赖于云平台本身,依赖于我的技术成熟度;我的安全我知道该怎么做,因为我有政策要求,我有等保要求,我有PIA 个法的要求,还有可能因为我要面临大量的线上,所以我要做一些安全架构。

过去我们讲了这些客户也理解了,但是这几个支柱之间,我们的客户不理解。他说我做一个应用的加固,我从哪里开始?我们的客户突然发现他不知道怎么讲。他说我先做稳定性还是先管成本?因为稳定性和成本是天然的有对抗的,大家这个应该能理解。因为稳定性的增强,带来的是工作负载的相关的资源的配套的增加,在安全上面的增加。他为了保证已有稳定性的基线,再增加,它是逐层增强的,那逐层增强带来是什么?就云的投资更加多起来。

一旦多了,老板就会问说你为什么要给我这样的一个建议,因为我的投资已经没有那么多了。但是你为什么要让我去加固我的应用?因为我出现了疑似问题吗?不是。所以这里面有个很重要的视角跟大家分享一下。

第一个视角,这根线的走向,大家可以看,这根线走向是我们管理者走向。我们的管理者在思考一个应用介于云的治理和管理,包括往上走我们叫技术运营这个位置的时候,他的思考的正确路线应该是从什么?从组织、成本、稳定、安全到性能、效率,它应该是这样一个路径,所以我想在这里跟大家很重要的分享一点,我们做Well-Architeched(云卓越架构,简称WA),我们做技术管理者,我们做技术工程师的专家,我们一定要有策略地完成各个支柱之间的互相配合。如果没有办法理解这一层的话,你就会发现做了很多这一层,比如说我们今天有个客户,他把运营先做了,好,运营做完之后,他说我的稳定性不行,他把稳定性做了,稳定性做完之后,他就做了安全合规。最后老板过来说你为什么成本不降本?结果他把成本降完之后,前面三个支柱的所有的、交付的基线和交付的质量也都有一定的下降。所以在这里我想跟大家抛出第二个观点。我们的技术的人员,我们的技术工程师在走访的时候(包括我自己也是技术出身),他的思考路线是这样的,从稳定性往上走到安全合规,再到性能,再到成本,他把成本是放在最后的。

所以在这个云的报告当中,我其实特别想跟大家传递一个观点,埃森哲在支柱之间互相互斥的作用里面,他有个非常深层次的理解,就是如何理解今天你的企业在一个业务当中,你要进行WA的支柱加强、加固,或者说你要为了满足接下来业务本身倒推过来的发展,今天我运用了这套模型的时候,怎么去做好它,它是有一套思考模型的。这个思考模型就是我们经常讲的framework。跟我们的WA一样,跟我们的前面的杨主任的评估的等级也是一样。所以做技术的同学一定要理解,每一个支柱下面都有非常深层次的内涵的理解,这个内涵更多的是跟管理周期和技术的技术周期相结合的。所以这里我把这个观点,最重要的洞察分享给大家。

然后接着我们把案例讲讲,我不讲具体怎么做,因为接下来会有我们的客户,还有我们非常优秀的伙伴安畅跟大家分享很具体的实践。我们先讲第一个案例,就是金融企业。我们讲金融企业在上海是最多的,尤其是外资,我们遇到了很多客户跟我们讲了一件事情,就是说你先告诉我你的Common Sense是什么,或者说你告诉我你们的常用的挑战是什么。你先把你的标准答案告诉我,然后我再看看我该怎么做。所以大家知道吗,如果你没有标准答案,你就没有任何去提出架构改善的这个可能性。因为深度思考的背后是带来了很多对架构本身的理解的负责任的表现。所以在金融企业我们调研了五家,他们提到了怎么样去做成本,但他们经常讲效益经济治理。今天金融企业在云平台上的投资是非常巨大的,当这个巨大的投资背后承载的业务没有达到预期的时候,大家可以想象一下这个话题会轮到谁来去承接这个话题,就是我们的IT基础设施的平台。你们该缩容了,你们该降本了,你们该把两地三中心建变成两地两中心了,你们该完成最基本的合并的操作。这个操作就是把很多机房合并在一起,把很多负载同时地回归到一朵云身上,不要再强调多云容灾负载。所以这个时候,我们给到他标准答案。

我们随便举个例子,举一个最关键的,就是最上面这一层。我们每次拿着这个标准答案去问他的时候,客户说,好像我还真的还没有在团队内部明确过这个支出、退款、承诺和优化的目标谁来认领。大家记住这不是技术的承诺,这是管理业务结果的承诺。所以如果你对业务结果承诺起到了足够的影响,你就会发现这个组织活力非常强。同时他在认领这个目标的时候,他会完成一系列的管理操作,这才是高阶的管理方式。所以接下来下面的几点我就不详细说,但是大家可以看到,基本上每一个域里面,我们的FinOps也好,我们的GreenOps也好,我们的专项成本治理方案也好,还有我们的利润转型的方案里面也好,多数的客户都应该去问自己一个问题,我们在几个域里面真的在做成熟度判断吗?

还有一个很重要的例子,第三个,叫云的预测。我们有一个客户也是MNC企业客户,他问了我一个问题。他说你能不能帮我预测一下,我下个月要付给某某某云厂商多少钱?我说你能不能把上个月的账单导给我,他导给我了。我大概看了一下98,然后他说是不是下个月也是98?我说那不出意外就是下个月98,但他给我的结果是我下个月会有一个很重要的缩容控动作,但是我不知道我能减到什么程度。我说那你有没有做过预测?预测是管理性动作,不是技术性动作。当你的技术动作完成之前,你的管理动作要在之前跟他一起配合完成。所以它会出现一个很重要的东西,就是我们通用的做法,手动报告,评估、计划和实施的消费的情况。但是我们的领导实践,你会发现他跟很多我们的服务商做了合作,同时他跟我们的相关的工作负载的团队做了很密集的配合。所以切记云的高阶管理和云的企业级管理,它不是一个团队完成的。它是一个建立在治理的基础之上,来跟多个团队有计划、有条理、有框架地完成技术周期和管理周期相配合的动作。所以基于这个的东西,我们就跟客户做了非常多的互通和交流。但实际情况是我们并没有教会他太多技术,他都自己就慢慢就明白了。所以我想跟大家讲,不难,难在怎么想这件事情。

第二个,我们今年我们经常讲管理、治理、运营、经营这四个技术周期和管理周期。我们有个能源客户,他非常的成熟,你所想到的所有优秀的管理方式他都有。但是他为什么还是找到了我们,我跟大家讲讲一个很重要的事实,就是他不知道怎么样用一个很合理的方式,把Landing Zone的体系持续不断地在未来的一年保证高效率的运转。什么概念?就好比今天你去了一个非常重要的专家论坛,他告诉你接下来你的营养餐应该这么吃,但是我只会给你菜单,给你营养餐菜单,后面的日子你自己看着办。你没有一个监督者,你没有一个审计方。所以我想再跟大家讲,就是优秀的技术背后和成熟的治理框架背后,他应该建立在一个可持续的发展的角度去看待。

所以这个客户就告诉我说,你能不能保证我的Landing Zone的架构体系能在今天交付之后,到了半年之后,仍然是以一个非常高标准的状态在运转。所以我们为他制定了一套基于WA的运营模块维度,看到的是稳定和安全这两个角度,给他制定了一套方法论和制定了一套可持续的运转的服务。大家可以看到最左边是我们的Landing Zone的八个模块,中间是我们八个模块可能会涉及到团队,所以大家注意,Landing Zone不是一个技术团队,他是公司的全团队,他是很好的能帮助你理解我们这个企业组织在IT的整个治理框架里面是怎么运转的。

再往下,我们对接到了人,我们找到了支持。那现在要干嘛?Landing Zone要交付一套审计体系,所以我们在左侧给了他一套审计体系。这套审计体系是依据Landing Zone原生的方案演化出来的个性评分标准。注意,个性的评分标准,就是要符合他实际的业务的运用、工作负载的情况,给到他切实际的个性化的东西。所以它里面有非常多的清单,每条都要去检查,每两周检查一次,每三到四周做一次汇报。这个跟云治理中心里面的配置审计合规包有异曲同工之妙,但是我们的云平台里面很少嵌入企业客户的组织情况。

所以这里,如果我们要做好治理的最佳落地,我们一定要明白企业的内控设施是什么。作为技术人员一定要知道我们的内控安全管理规则是什么,不要忽略它。不要找到一个安全团队的同事过来说,你告诉我怎么做,这样不行的,这不是企业IT工程师高阶发展的一个路线。基于这个,我们往下看,这是我们的合规包,非常成熟的方案。这个东西是诞生在阿里云上面,他也运转在阿里云的客户身上。

基于这个,我想跟大家再分享下一个方案,在零售行业,我们有一个非常重要的效率和标品的实践,但在这里我不想讲怎么做,因为比我厉害的人很多,比我强大的团队更多。我想跟大家讲,就是我们作为咨询公司,经常讲顶设,经常讲价值连续性,经常讲一件事情在立项的时候,再往后做的时候,它的可持续在哪。所以我们要回归到本质是什么,本质就是当你做了IaC,你知道IaC在完成什么事情,解决业务什么问题,你先回答我一遍。所以当我们去参与到一个客户的时候,零售行业一个客户,他就问了我们说,我是一个技术团队的工程师,我知道要做这个事情,但是我并不知道怎么回答业务团队,回答我的Global团队我做这个事情的直接收益是什么?

收益就在我们的PPT上面,大家注意下面,降低规划成本,降低平台部署成本,降低我们的交付成本。所有的字都非常的精准干练,但是到什么程度其实已经不重要,因为你已经把价值的本质面提炼出来了。作为工程师,如果今天我要降低交付成本,我要降低的部署成本,你的标品应该怎么做?就是要把标品在最开始的那一部分整个交付里面的细节全部梳理清楚。要交付什么组件,版本多少,应该打什么补丁包,如何做Golden Image,如何做DevOps发布,你全部要梳理完。这个过程一定不是一个人完成的,他是一个团队或多个团队完成的。所以在零售行业的实践当中,我们其实多次在跟客户聊的时候,基本不是客户不会做,是客户没有想明白怎么做。

所以我想在这里再次跟大家分享一个很重要的一个认知:报告的解读,其实来自于客户真实的情况的洞察和改变,和他的想做改变方向的一些判断。基于这个事实,我们能看到这份报告背后有非常强的指导意义,这个指导意义是对所有行业都有指导意义的。就像前面我的领导分析的一个很重要的结果,就是文旅行业对Landing Zone、对WA,它的重视程度关注程度并不高。原因是什么,因为它还是传统的Web应用,传统的业务并不需要大量的改造。但是为什么互联网那么重视,因为他已经把弹性发挥到极致了。弹性发挥到极致的背后就是优化,极致的优化。一旦涉及到极致的优化,对于我们来讲,我们传递给客户公司最重要的事件是什么?就是如何做。

基于这个,我想跟大家在这里再次跟大家PR一下。这份报告会在年底发出,我们会跟阿里云团队一直共创到年底,并且非常有责任地为每一份数字提供基本的责任心。所以大家可以期待一下,这份报告会像往年(一样)通过各种媒体、媒介、官网去发布,可以自己下载,包括23年的报告,现在大家也可以自己去下载。在报告的发布之前,大家可以敬请期待一下,因为今天只是把报告里面最重要的数据分享给大家。

我想在这里再次感谢一下我们阿里云团队,然后感谢一下我们一起在奋斗的埃森哲的同事。然后在这里我想再跟大家留一个话题,既然来了,一定要丢一些新的东西,不能说只是讲一些过去的东西。我们在讲云的治理阶段、技术周期和管理周期,我们讲到了怎么做,怎么想。但是大家可能没有想象过一件事情,因为我们现在遭遇了非常多的客户,在把他的基础设施变成智能设施。

这个变化非常的快,快到已经没有时间去思考云的治理该怎么样更合理的治理了。他希望请你在我的AI的基础设施上面,帮我完成责任心、道德、意识、国情、法律等一系列的这种治理手段,我们讲Responsible for cloud governance以及Responsible for AI,这一点我希望大家能理解,就是这份报告在背后它所传递的一个趋势,是来自于治理是存在在每一个工作负载当中的每一个环节的。那这里面一定是管理的颗粒度为先,技术的颗粒度保证我们的管理颗粒度的落地。因为只有达到这一点,你才能明白我们的Landing Zone、我们的Well-Architeched它在背后所传递出来的非技术的价值是什么。这不是PR,这是真实的我们的感受。因为在实际的客户落地的过程当中,客户突然恍惚了一下,原来这不是一个技术交付,这是一个组织流程、机制、约定、规范等一系列可前瞻性的往后延展三年的规划。

完整视频及更多内容:

视频:

2024年度云治理企业成熟度发展报告解读(一)云市场发展洞察

2024年度云治理企业成熟度发展报告解读(二)云市场背景调查数据

2024年度云治理企业成熟度发展报告解读(三)五大支柱关键数据解读

2024年度云治理企业成熟度发展报告解读(四)支柱结构关系及案例分享

相关文章
|
2天前
|
编解码 Java 程序员
写代码还有专业的编程显示器?
写代码已经十个年头了, 一直都是习惯直接用一台Mac电脑写代码 偶尔接一个显示器, 但是可能因为公司配的显示器不怎么样, 还要接转接头 搞得桌面杂乱无章,分辨率也低,感觉屏幕还是Mac自带的看着舒服
|
4天前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1540 5
|
1月前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
7天前
|
人工智能 Rust Java
10月更文挑战赛火热启动,坚持热爱坚持创作!
开发者社区10月更文挑战,寻找热爱技术内容创作的你,欢迎来创作!
581 22
|
4天前
|
存储 SQL 关系型数据库
彻底搞懂InnoDB的MVCC多版本并发控制
本文详细介绍了InnoDB存储引擎中的两种并发控制方法:MVCC(多版本并发控制)和LBCC(基于锁的并发控制)。MVCC通过记录版本信息和使用快照读取机制,实现了高并发下的读写操作,而LBCC则通过加锁机制控制并发访问。文章深入探讨了MVCC的工作原理,包括插入、删除、修改流程及查询过程中的快照读取机制。通过多个案例演示了不同隔离级别下MVCC的具体表现,并解释了事务ID的分配和管理方式。最后,对比了四种隔离级别的性能特点,帮助读者理解如何根据具体需求选择合适的隔离级别以优化数据库性能。
201 3
|
10天前
|
JSON 自然语言处理 数据管理
阿里云百炼产品月刊【2024年9月】
阿里云百炼产品月刊【2024年9月】,涵盖本月产品和功能发布、活动,应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。
阿里云百炼产品月刊【2024年9月】
|
11天前
|
Linux 虚拟化 开发者
一键将CentOs的yum源更换为国内阿里yum源
一键将CentOs的yum源更换为国内阿里yum源
580 5
|
23天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
7天前
|
XML 安全 Java
【Maven】依赖管理,Maven仓库,Maven核心功能
【Maven】依赖管理,Maven仓库,Maven核心功能
233 3
|
9天前
|
存储 人工智能 搜索推荐
数据治理,是时候打破刻板印象了
瓴羊智能数据建设与治理产品Datapin全面升级,可演进扩展的数据架构体系为企业数据治理预留发展空间,推出敏捷版用以解决企业数据量不大但需构建数据的场景问题,基于大模型打造的DataAgent更是为企业用好数据资产提供了便利。
327 2