云上的消费你真的算清楚了?

简介: 上云的ROI如何?钱都花到哪里去了?如何做预算?怎么样能够更省钱?这些问题反映了企业上云的一系列和成本相关的三大诉求:成本可视化、消费可预测、成本优化。其中,成本可视化,即把账算清楚,是基础中的基础。

ttyacxbd.jpg

我们在淘宝上买东西的时候都会看看商品的价格、优惠券,去算清楚我们购买这个东西到底花了多少钱。企业采购更是如此,每一笔钱用在什么地方,必须要记录的清清楚楚。

——上云的ROI如何?钱都花到哪里去了?
——如何做预算?
——怎么样能够更省钱?

这些问题反映了企业上云的一系列和成本相关的三大诉求:成本可视化、消费可预测、成本优化。其中,成本可视化,即把账算清楚,是基础中的基础。

今天我们就来看看如何在云上把账算清楚!

云上成本分摊如何定义?

除了从成本上了解云上的消费外,企业还需要更细粒度的了解钱是怎么花的。这个是我们通常所说的分账。分账能够帮助企业把云上的支出进行拆分,按照应用、项目、部门等维度透视。这样一来企业就知道每一个项目ROI如何。

企业上云的步伐是循序渐进的,大部分是一个BU先上,独立进行管理。这个时候还没有分账的需求,因为每一个BU是独立结算的。当企业规模化上云之后,用云团队和云上支出开始增加。管理模式也从分散式的管理转变为由Cloud governance团队(或者中心运维团队)集中管理,进行统一的支付和成本分摊。

企业中的分账大体分为两种模式:

Showback: 把账按部门算出来,给CFO和部门高层看一看,通常没有预算、独立核算的要求。互联网企业很多采用这一模式。

Chargeback:把账按部门算出来,除了review之外,各个BU独立的进行IT成本计费和预算管理。采用这种模式的很多是传统企业和MNC。

Chargeback的管理方式更加成熟,帮助IT部门从成本中心转型成能力中心。

云上分账遇到什么问题?

既然showback和chargeback都是标准做法,为什么上云后这个问题变得突出了?在传统自建数据中心的模式下,IT基础设施的采购严格按照企业的财务预算流程、采购流程和交付流程执行,其成本按团队或项目可以被很好的管理。企业上云之后,完全打破了这个体系,有几个凸显的大问题:

Q1:云上商品种类纷杂,形态各异

云厂商是一个超级供应商,什么都卖,面对上百的产品类目、上千的商品类目、上万的SKU和计费项,不知所措是一个自然的状态。除了标准的虚拟机,大部分商品对于客户都是新事物,而对于新事物,分账不是大家最开始会考虑的问题。

Q2:云厂商对于标签分账的支持都有发展的过程

除了微软Azure第一天支持标签外,AWS的标签也是从几款到2018年的几十款,再到2020年的上百款。在这个过程中,非常多的资源无法进行打标签,到现在也是一样。在阿里云这个情况更加突出,到2020年9月我们的标签分账才支持到28款云产品,而在2020年4月份这个数字是3。所以,我们的客户重度使用标签的为数不多。

Q3:IT治理体系的缺乏

IT部门需要标签,但是在云上打标签的是各BU的DevOps团队,如果一个企业缺乏Cloud governance的流程,程序员们是不会自己打标签的。

企业要分账,应该怎么做?

A:Leadership review流程的建立

分账的机制能够执行必须依靠Leadership review的支持,让成本核算作为月度或者季度业务复盘的一部分。只有自上而下,才能保证其他流程的有序开展。

B:账号维度进行分账

目前很多企业上云都选择基于资源目录管理的多账号模式。这种模式下,在Applications的目录下,每一个Application就是独立的账号。因此这个账号下的所有费用可以全部的计入这个部门的成本。对于多账号,我们推荐企业使用阿里云开放平台即将推出的集团企业IT治理样板间,样板间中我们对于Account的命名方式和Folder的组织都有很好的最佳实践。

1111111111111111111111111111.png

C:标签维度分账 - 独享型资源型

对于多个部门共享的账号,则需要通过标签的方式去区分资源的用途。 在这个过程中,运维团队负责标签的职能和执行方式有所区分:

(1)高度自动化的企业会把标签的部分做到服务传输的流程中,保证所有的资源尽可能的打上标签;
(2)运维开发能力较弱的企业则会选择手动在控制台打标签或者使用MSP外包这部分的工作。

无论何种方式,当标签被打好后,标签就会从资源管理的系统流转到费用中心的账单中。通过Excel或者其他BI工具,用户就可以看到费用和部门的关系(阿里云的财务单元可以和标签进行关联,并同时出现在账单中)。

对于不能打标签资源或者没有打标签的资源,需要定期的进行review(可以使用config中提供的require-tag模版进行这一操作)。如果资源应该打标签而没有打,尽快补齐;如果资源打不了标签,去给阿里云提需求。通过这样手段,让这部无法通过Tag分账的分费用控制在10%以下。

2222222222222222222222222222222.png

最终,在标签分账这部分,你可以给企业的CFO一个较为准确的成本分摊,以及汇报分不出来的部分作为follow up action。具体的操作可以参考Tag分账最佳实践

D:共享型资源的分账

对于许多共享性的资源,例如CEN,NAT网关,流量包,预付实例券(RI)预付款,support plan,云厂商没有提供更细粒度的分账方案。目前通常的做法是按照一个商议好的固定比例来进行分摊。

如果需要更精准分摊的能力,则需要进行更多的计算,例如:

流量型产品:网络流量去分摊各个虚拟机的费用给部门。

预付实例券(RI):RI通常也是IT集中采购,进行内部的成本优化。通常来说RI都不会过量购买,例如去优化60%~80%的固定成本。由于RI的匹配存在一定的随机性,在账单中会存在局部“不公平”的现象,在拆分这一部分成本的时候会有一个更复杂的公式,考虑到RI是整体优化方案的这一特性,RI的规格以及各部门使用该规格虚拟机的情况。

容器应用:容器服务集群通常在应用层由多个应用公用,而费用计算是在基础的IaaS资源维度,利用https://kubecost.com/ 可以进一步按应用来分摊成本。

您的企业在云上的账算清了吗?欢迎和我们咨询和交流~

更多企业IT治理样板间内容
请立即扫码观看

专场回放二维码.png

相关文章
|
2月前
|
消息中间件 存储 运维
云消息队列 Kafka 版全面升级:经济、弹性、稳定,成本比自建最多降低 82%
本文介绍了阿里云云消息队列 Kafka 版的全面升级,强调了其在经济性、稳定性和弹性方面的显著提升。同时,与 Apache Kafka 相比,云消息队列 Kafka 版通过节省 66% 的资源,实现了客户使用成本比自建最多降低 82%。
|
2月前
|
消息中间件 运维 UED
消息队列运维实战:攻克消息丢失、重复与积压难题
消息队列(MQ)作为分布式系统中的核心组件,承担着解耦、异步处理和流量削峰等功能。然而,在实际应用中,消息丢失、重复和积压等问题时有发生,严重影响系统的稳定性和数据的一致性。本文将深入探讨这些问题的成因及其解决方案,帮助您在运维过程中有效应对这些挑战。
46 1
|
7月前
|
消息中间件 运维 监控
ApsaraMQ Copilot for RocketMQ:消息数据集成链路的健康管家
阿里云消息队列 ApsaraMQ 始终围绕“高弹性低成本、更稳定更安全、智能化免运维”三大核心方向进行演进和拓展。在智能化免运维方面,通过 ApsaraMQ Copilot,为企业提供消息数据集成链路的健康管家,让消息服务走进智能化免运维的新时代。
71871 79
|
5月前
|
消息中间件 监控 Java
联通实时计算平台问题之监控Kafka集群的断传和积压情况要如何操作
联通实时计算平台问题之监控Kafka集群的断传和积压情况要如何操作
|
5月前
|
消息中间件 Cloud Native API
核心系统转型问题之消息队列提升交易响应时间如何解决
核心系统转型问题之消息队列提升交易响应时间如何解决
|
消息中间件 供应链 Serverless
5分钟打造应对流量洪峰的商城交易系统——基于云消息队列 RocketMQ和Serverless 应用引擎 SAE
通过SAE极速部署一个微服务电商商城,同时结合RocketMQ异步解耦、削峰填谷的能力,带大家体验面对流量洪峰仍旧稳定可靠的商城交易系统!
1931 1
|
消息中间件 供应链 NoSQL
消息队列+Serverless:实现高弹性的电商订单系统
基于消息队列以及函数计算,快速部署一个高弹性的商品订单系统,能够应对抢购场景下的高并发情况。
|
消息中间件 弹性计算 运维
消息队列RocketMQ版:消费异常运维排查体验
本实验场景介绍消息队列RocketMQ版的可观测工具功能,通过示例程序模拟生产环境消费业务故障,并通过产品提供的开箱即用的可观测工具定位消费异常。
消息队列RocketMQ版:消费异常运维排查体验
|
消息中间件 移动开发 运维
消息队列和应用工具产品体系-14-容量规划及不同模式的适用场景
消息队列和应用工具产品体系-14-容量规划及不同模式的适用场景
消息队列和应用工具产品体系-14-容量规划及不同模式的适用场景
|
消息中间件 存储 Cloud Native
云原生中间件RocketMQ-消费者消费模式之广播模式
云原生中间件RocketMQ-消费者消费模式之广播模式
968 16