今天我们讲讲云厂商的核心利益——如何挣钱。
公开谈这类内容需要脱敏,我提及的推导过程和详细数字都以公网公开报价为准,不会涉及现在和过去工作单位的经营状况;因为只用常识推导不涉及具体技术,也给业内同行留足了用自身技术继续解释的空间。
云计算产品繁多,IaaS层云产品是按资源池付费,要先看超卖比再看市场价,PaaS服务是按量付费,直接看成本和市场价的区别。
IaaS云资源的超卖—— CPU、内存、硬盘和带宽
云计算超卖和机票超售差不多,即你实际售出的资源数量,大于实际拥有的资源数量,赌的就是客户不会100%用满。
做云计算成本预估首先要考虑到资源超卖,但超卖是一门学问,超卖不同资源的后果完全不同。IaaS层从硬件开销角度看只有四类资源:CPU、内存、硬盘和带宽,每种资源的超卖策略和影响都不同。
首先说CPU可以放心超售,只有极个别高算力用户会受CPU超售的影响,就算过度超售也不会宕机。但是CPU资源默认就很充足,用不尽的资源没必要过分超售。
内存超卖天生就是个无解的话题,超卖内存会带来的巨大性能开销,只要国内想长期正规运营的厂商,只要不是最低配的个人机型,都没人敢动超卖内存的主意。
云硬盘超卖一般说的是类似Ceph+SSD的网络块存储,本地盘既没油水又没必要超卖。网络块存储有共享IOPS的优势,可以“延迟分配”给客户硬盘,即客户买个600G的云硬盘只用了1G,则实际上只占有用了1.1G的磁盘空间,等驱动要写入新空间时再扩大到1.2、1.3G。这样做的初始超卖比非常高,但后续会越来越接近真实售卖容量,而且客户只删除数据不会回收硬盘空间。这种超卖的风险是直接锁死存储引发计算群集宕机,所以云硬盘超卖比要靠运营人员艺高人胆大。
公网带宽的超卖风险和IDC运维差不多,带宽越小的客户超卖潜力越大,假设客户买5M带宽日常能用1M就不错了,但客户买10G带宽很可能会用够9.5G。
云主机的成本和售价分析—— 云主机和RDS,账面上利润丰厚
我们先拿云主机和RDS进行成本和售价分析,看他们默认亏不亏。我们选16G内存的典型配置(备注1),云主机4C16G配置是每月¥550,RDS选16G内存机型是每月¥1800。Mysql RDS默认做了主从双实例内存占用翻倍,而且还有其他内存开销,所以实际成本和云主机差不多。
一台主流配置(备注2)的服务器硬件造价不超过5.5万元,每月机柜成本约为400元,按照3-4年硬件折旧周期,服务器和机柜成本每月成本在1500-1800之间。假设该服务器虚拟出8台16G内存的虚拟机,按媒体价每月产生的收入是4400元,从账面来看云计算资源即使不做任何超卖都有充足利润。
但是规模最大的阿里云至今未实现收支平衡,其他云厂商也没有说盈利的。这里既有人员、市场等其他成本,但一个重要原因是云计算行业有个叫“资源闲置”的吞金怪兽。大批量采购硬件的过程中就有资源浪费,而客户可以按需申请虚机也要预留大量资源,而损失最大的场景来自大客户突然流失带来资源闲置。
中小型云厂商客户关系固定较少出现资源闲置的,甚至说中小厂商会最早实现盈利。如果按照项目制建设和扩容私有云平台,那会有固定客户来负担整个维保周期的费用。大型公有云平台反而拉不下面子,心虚嘴硬的大喊来去自由按需付费,但正如我在上一篇文章所说的,按需付费的代价就是或者所有客户分担空置资源的开销,或者客户想买资源的时候售罄。
AWS的竞价实例从一定程度上缓解了此类问题,但大部分用户业务不能用竞价实例,而且友商跟进后竞价实例价格会继续跳水。很多云平台看资源实在是闲置可惜,一般就做促销拉过来小客户,然后友商的资源又该空置起来了。
云存储的成本和售价分析—— 云硬盘和对象存储,副本就是成本
云存储资源分为两种,IaaS层的云硬盘和PaaS层的对象存储(当然有些人把对象存储是划分在IaaS里面的)。
典型的云硬盘我们选600G中高速云盘,价格是每月180元,四年折旧客户总支出是8600元。但三副本SSD的硬件成本得有10000块(备注3),云硬盘资源就是靠着延迟分配空间来保证赚钱的,延迟分配还能降低资源闲置风险。但是遇到大硬盘快速写满的客户,云平台不仅亏钱还要承担群集超卖后崩溃的风险,这类客户该引导到对象存储。
对象存储是个PaaS服务,其不存在超卖但也要预留资源保证始终可写入。各家技术有高低,我们按照理想化场景来算,磁盘的成本占整个群集成本的一半(备注4),已知一块4T盘的价格是1000元,如果按照3年折旧给客户做单点三副本群集,每T每月成本是64元(备注5),当前公开售价120元是不亏的。但如果做多地容灾三副本就抗不住成本了,必须得用多机房纠删码技术。
网络的成本和售价分析—— IP地址和带宽,哪个更有猫腻
网络成本首先要说IP地址,因为IP地址是一次性买断的资源,云计算厂商没有后续投入,IP占用收费就是在逐步收回购买IP段的投资。
到带宽部分,一般5M以下小带宽售价是25元/M/月,5M-200M带宽售价是80元,200M以上走定制订单不公开报价。业内均价来看,代播静态BGP的成本是100元左右,动态真BGP的成本是300元以上。厂商成本到客户售价之间的价格鸿沟靠的就是带宽超卖来填平的。笔者亲眼观测几个IDC做的小群集里,小带宽用户的带宽超卖比超过了70倍,5-200M带宽超卖比能到3-5倍,而每个大于200M的带宽订单的价格都是秘密。
其他涉及成本利润的问题—— 融合、维护、数据运营
本文算利润时不关注包年甚至包三年的预售折扣,因为虚拟化的硬件也在降价和升级,而且提前一次性缴费有额外金融收益,长周期客户的维护成本也会降低,最终实际利润率和客户按月付费差不多。
国内云平台即使关机也要按照开机收取CPU内存费用,那是因为“理论上”(备注6)客户关机了也保留内存准备再次启动,如果客户很在意云平台的关机持有成本,完全可以将主机制作镜像后删除。国外厂商不保证下次系统肯定有内存可以开机,甚至IP都会开机时更换,所以不是国内厂商太贪婪,而是国外厂商的承诺更经济。
精算自建CDN的成本和利润的文章已经有很多了,我这里只提一下融合CDN的核心竞争力。融合CDN看似毫无科技含量的二道贩子,融合采购的成本也比自建节点更高。但融合CDN没有节点带宽空置成本,即融合CDN没必要为短时间的带宽峰值做几十G的带宽扩容,也不会因为扩容带宽不合算而降低服务质量。
融合云计算看似能像融合CDN一样降低资源池空置率,但云主机和云容器没那么好搬,我们只能等到 Serverless 成为行业事实标准以后,才能玩像融合CDN一样的融合云计算。
正如上一篇采购篇说的,一个云厂商就是半个IT业,企业IT咨询服务是未来行业的营收突破点。当前云计算客户还是价格敏感型,而且客户还自有IT技术人才,导致云厂商不敢报出来四千一人日的价格。但是随着高增值客户的增加,以及客户技术团队将精力彻底转向业务逻辑,企业服务会成为比资源贩售更重要的利润组成部分。
总有一些云平台异想天开,想通过插手用户运营和用户数据的方式实现盈利,我认为这是想多了,那么多IDC和CDN有谁成功控制过自己的客户?云计算市场一开场就是激烈竞争,云平台根本没控制客户的议价权,黑产偷到的数据也没法写到财报里。
如何面对各类客户—— 小客户、性价比优先客户和服务优先客户
在云计算厂商来看,客户可以分为小客户、性价比优先的客户和服务优先的客户,看完下文大家会觉得卖云计算和卖IDC的方式一样。
首先看小客户,大都是初始创业团队或者个人站长,这类客户就像买散U共享带宽的IDC用户一样带宽超卖比极高,但云平台的压力主要是单价低、压榨硬件极限、服务成本过大,云平台一年辛辛苦苦赚20块钱,客户发个投诉微博就全毁了。
大公司如果用toC的霸王条款欺压小客户,会是自毁形象影响打其他大单,而且蛮横客服会误伤大中型客户,大公司如果把每个小客户都做高标准支持,成本根本扛不住,而且会遇到各种碰瓷专业户。这类客户还是留给运营成本更低的小IDC云吧,他们的运营成本和策略更灵活。
各大云平台不用为了小客户的成长潜力而强拉到自己平台,乙方自认为养大了甲方是白痴的自作多情。企业间的生意永远只是生意,小客户规模变大会更有议价能力去挑选供应商。吸引小客户不如影响小客户,做好中立的云培训和宣讲维持圈内的高大上形象,放出顺手的免费工具包实帮朋友们解决问题,结下单纯的善缘比被客户边用边骂能走到更远。
性价比优先的大客户其实挺好相处的,对方就是想找个物美价廉的供应商,云平台该学学自己的服务器供应商,他们怎么能做到超低利润运行的?如果讲不清产品性价比是营销线的责任;如果产品性价比确实不够那就让技术团队改进;如果友商烧钱赚客户,那友情提示一下客户不要签强捆绑的合同;如果客户一定要极限低价,那客户必须用法务合同承诺不让云平台承担资源空置等风险,不签合同的时候云平台连条内存都不会买。
服务优先的大客户会善意保证云平台的利润,云平台必须以稳定服务、承担责任、工作减压、技术引导、帮忙捧场等方式回报客户。这类客户也并不都是国企,很多互联网企业也不在意云计算成本占总成本的5%还是7%,能提供稳定的服务总好过烧钱促销的时候业务宕机。
目前以此为卖点的云平台很少,因为每个客户都要精耕细作,中小型云平台因为法务、沟通、决策的成本较低,才能通过无限服务的方式留住客户,但中小型云平台需要费力招揽能无限服务的人才。大型云平台敢拍板又能拍板的精英还是太少了,最终优质客户的竞争又变回了售前和方案人才的竞争。
为保证阅读流畅性,我将大量推导信息引到了文末,有详细数据推倒热情的读者可用看备注。
备注1:云主机不要选择最低配的1C1G的机型,那个机型的超卖比就不是给企业用户用的;RDS因为能连带吸引云主机等消费,多个厂商对低配RDS有费用补贴,其价格不中立。
备注2:正文说的5.5万元的物理服务器的参考配置是: 2*12cpu+256G内存 4*800G SSD+2*4T SATA +2*万兆网卡模块+附属网络设备。5.5万的服务器加上每月400元的机柜成本,3年折旧每月成本是55000/36+400=1927,四年折旧成本是55000/48+400=1545。
备注3:中高速云盘的硬件基础一般是三副本中档SSD加上网络,标记容量800G的硬盘实际可用也就600G。一块中档 800G SSD硬盘价格不超过3000,三副本SSD加上其他硬件成本得有10000以上。
备注4:技术理想环境下,整个存储群集80%的硬件成本在存储节点,整个存储节点70%的硬件成本在磁盘,10%的硬盘空间要预留等待新写入,0.8*0.7*0.9=0.504,即磁盘的成本占整个群集成本的一半。
备注5:一个磁盘有10%-20%的空间要预留做维护用,4T只能算3.2T可用空间;单盘功耗7瓦加上其他设备功耗,单盘可以按每月20块机架费来算。如果按照3年折旧给客户做三副本群集,每T每月成本是(1000*3+20*36)*2/3.2/36=64元 ,详解是 (1000*3 三倍磁盘价格 + 20*36 3年机柜费)*2 磁盘开销占总群集成本50%/33.2T可用空间/36 客户分期36个月付款。用三副本做对象存储是最初阶最浪费硬盘的技术方法,现在各平台都已经逐步过渡到纠删码了。
备注6:理论上客户关机了云平台也保留内存准备再次启动,这是守规矩厂商的做法。实际操作过程中不排除有云平台冒险“盗卖”关机者的内存;也不排除有些小型云平台想“盗卖”但技术不够,因为有些技术实现会带来的连锁反应会很好玩。
本文作者:曹亚孟
来源:51CTO