更多精彩内容,欢迎观看:
带你读《云上自动化运维宝典》——ECS省钱指南来啦!万字长文教你如何选择与业务形态最匹配的付费方式(1):https://developer.aliyun.com/article/1405383
下面重点介绍一下节省计划和预留实例券的区别。
节省计划具有更好的灵活性,支持多规格族、多地域部署场景下资源账单抵扣需求。节省计划真正做到了财务和资源的解耦,不再和资源使用的台数做绑定。预留实例券只能抵扣计算规格的账单,而节省计划可以抵扣计算、系统盘、数据盘和固定带宽的账单,但不同的计费项的折扣力度不同。
节省计划相比预留实例券可以简化对账,节省计划还支持多种产品,比如ECS、ECI、RDS,未来还将支持更多的云产品。节省计划不支持按月最低购买时长为一年,而预留实例券支持按月购买。
节省计划分为通用型和ECS计算型。
通用型节省计划具有更大的灵活性,支持地域级灵活性和规格族级灵活性。简单的说就是我购买一份通用型的节省计划,可以覆盖全地域、全规格的ECS资源。
而ECS计算型节省计划只能覆盖特定地域下,特定规格族的ECS资源。在购买的时候,我们就需要指定地域和指定规格族。但计算型节省计划可以提供更低的折扣,等于牺牲了灵活性换取到了更好的经济性。
下面我们来看一下节省计划的应用场景。
第一个场景,多规格资源的弹性业务。比如在之前预留实例券应用场景里提到的弹性场景,如果弹性业务集群使用了多规格族的资源,使用预留实例券就很难做到全面的覆盖。而节省计划可以覆盖不同的规格,这种场景下就推荐使用节省计划+按量付费的方式。通过对业务资源的预估,计算每小时承诺消费金额,购买对应的节省计划降低资源的成本。
第二个场景,弹性升降配。对算力存在变化,需要通过升降配调整机器资源配置的场景,如果使用包年包月的实例,会存在两个问题,第一个是实例的生命周期维护比较复杂,第二个是在升降配退款上会产生隐形成本。使用节省计划+按量付费的方式,利用节省计划支持规格灵活性的特点,可以随时的调整资源配置。
第三个场景,混合部署。适合同时有多个业务上云的场景,不同的业务在不同时间段使用的资源数量不同,比如白天的业务们使用大量的机器提供在线服务,晚上大数据部门使用机器资源做数据处理。这两部分的业务使用的机器规格不同,使用包年包月的实例,各业务都有一半的时间存在资源浪费。而使用节省计划+按量付费的方式,对多个业务的资源进行整体抵扣,可以实现跨规格的折扣权益共享。
接下来整体比较一下各个付费方式。
∙ 从经济性方面,最优的是抢占式实例,它最低可以提供按量付费一折起的费用,其次是包年包月和预留实例券。预留实例券通常可以提供和包年包月相同的折扣力度,购买一年的费用相比按量付费可以做到5.6折。再往后分别是ECS计算型节省计划和通用型节省计划,购买一年的费用相比按量付费分别可以做到6.1折和七折。
∙ 从折扣项来看,包年包月和节省计划可以抵扣计算、系统盘、数据盘、固定带宽的费用。抢占式实例和预留实例券抵扣的都是计算规格的费用,但计算规格在整体资源的费用中占比比较高,通常占比在80%~90。如果使用预留实例券,还可以搭配存储容量单位包SCU来抵扣云盘的费用。
∙ 在灵活性方面,和经济性相反,从高到低依次是通用型节省计划、计算型节省计划、地域级预留实例券、可用区级预留实例券。通用级节省计划具有最高的灵活性,支持跨规格族、跨可用区、跨地域的灵活性。在选择抵扣类产品的时候,可以根据资源的分布情况,以及需要支持的灵活性选择合适的抵扣类产品。
∙ 在确定性方面,包年包月和可用区级的预留实例券的确定性相对较高,而地域级预留实例券、ECS计算型节省计划、通用型节省计划,需要搭配容量预定来提升确定性。
下面我们来看一下具体的场景推荐,这里我列举了一些业务场景做付费方式选型的推荐,大家在选型的时候可以参考。
我把业务场景分为弹性业务和稳态业务。对于弹性业务,如果是无状态的,容错能力强的,比如科学计算、图像处理等等。这些场景对于算力要求较高,且算力存在波峰波谷,弹性需求也较高。强烈推荐使用抢占式实例可以极大的降低算力成本。
对于临时性的弹性业务不能中断的,推荐使用按量付费实例来支撑业务。典型的场景比如电商大促、突发热点带来的突增流量。在流量突增的时候,我们可以通过扩容按量付费实例来提供服务,等流量慢慢过去以后再去释放扩容掉的这部分机器。因为按量付费实例是按秒计费的,所以我们只需要承担扩容期间的这部分费用。
对于长期的弹性业务,比如游戏、互联网应用,算力需求本身是随着流量波动的,所以推荐使用按量付费+节省计划,按量付费实例用来支撑算力波动的灵活性,随时扩容和缩容,节省计划用来对按量实例进行抵扣,降低资源成本。
对于稳态的业务,如果是固定资源且长期稳定的业务,典型的有OA、CRM系统,数据库服务对灵活性要求相对较低,推荐使用包年包月。对于固定规格族的长期业务,比如DevOps,有多套环境使用的都是相同规格的配置,推荐使用按量付费+预留实例券。对于多种环境的混合部署,比如在线业务和离线业务同时上云的场景,不同的业务使用的机器规格不同,我们推荐使用按量付费+节省计划的方式。
在实际的使用中,可以根据业务场景组合多种付费方式完成业务支撑。对于稳定的业务负载,使用包年包月实例或者按量付费+抵扣类产品来支撑。对于突发型的业务负载,无状态任务型的使用抢占式实例,有状态、不能中断的,选用按量付费实例。
2) 选取合适的资源规格
首先看一下ECS的产品分类。ECS实例分为通用计算、异构计算、高性能计算。通用计算是ECS实例最常用的实例类型,适用于一般性的应用和服务器,提供了丰富的配置选择。支持垂直类场景增强型实例,比如网络增强型、存储增强型、内存增强型、安全增强型等等。
异构计算是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。目前包括GPU云服务器、FPGA云服务器、弹性加速计算实例等等。异构计算通过让最合适的专用硬件做最合适的事来调节能耗,从而达到性能和成本最优化。
根据场景来选择合适的规格,可以获得最优的性价比。
∙ 对于网站服务器、中间件,推荐使用通用计算实例和高主频实例。
∙ 对于大数据分析、分布式文件系统、数据库等,推荐使用存储型增强实例、大数据实例。
∙ 对于内存数据库,推荐使用内存增强型实例。
∙ 对于网关、网源、防火墙推荐使用网络增强型实例。
∙ 对于科学计算、视频编解码、图像渲染等,推荐使用GPU云服务器。
从产品的维度来看,通用计算实例可以覆盖最多的业务场景。
下面再来介绍一下通用计算实例的选型。
七代主售实例(g7、c7、r7),它具有最优的性能比,覆盖场景全面,是上云的第一选择。在今年5月,我们对七代主售实例价格再次进行下调,七代全部规格下调15%~20%,性能比优势再次提升。七代主售实例适合绝大多数通用场景,比如web应用、中间件、数据库、数据分析、科学计算等等。
倚天八代实例(g8y、c8y、r8y),它在2022年正式发布,采用基于ARM的自研倚天710芯片。倚天八代实例具有独享物理核,算力会更强劲。在多任务、高负荷场景,倚天的性能线性度表现更好,支持高负载运行。它适合计算密集型场景,比如web应用、视频编解码、高性能计算、AI推理等等。
通用算力型U实例,它是面向中小企业用户的企业级独享实例,和七代主售实例相比,相同算力购置成本更低。如果对于CPU和IO性能要求不高,希望进一步降低资源成本的,可以考虑使用通用算力U实例。它适用于对性能要求不高的场景,比如轻量级网站应用、离线数据分析、企业办公应用、中小型数据库等等。
性能突发实例T系列,它针对的是企业及个人用户持续低性能或者偶尔有突发性能需求的场景来设计。可以利用CPU控制基准性能满足一些突发性能的需求。主要面向入门级场景,最小实例规格是1c0.5g。如果对性能要求不高,希望以最低成本购置云上资源的,可以考虑使用性能突发实例T系列。适合的场景有轻量级应用、开发测试。
3) 提升资源利用率
在提升资源利用率方面,我总结了三部分优化内容。
第一,资源使用率优化。常见的方法有释放闲置的资源、降配低负载资源、升配高负载资源、弹性扩缩容等等。通常我们可以借助资源监控工具发现优化机会,并结合业务特性、性能、成本等综合考虑后来执行。
第二,抵扣产品覆盖率优化。需要关注预留实例券、节省计划的使用率和覆盖率。节省计划的使用率是用于查看节省计划的使用情况,使用率是指购买节省计划后有多少比例参与了抵扣,使用率越高说明节省计划的使用效果越好。节省计划的覆盖率是用来衡量按量费用的资源有多少费用被节省计划进行抵扣了,覆盖率越高说明这些按量资源的成本被节省计划很好的抵扣。
我们追求的是使用率高、覆盖率高的场景,这是最优的场景说明节省计划很好的帮助我们降低了资源成本。如果出现使用率高,覆盖率低,说明我们的节省计划可能买少了,还有很多的按量资源没能被节省计划抵扣。如果是使用率低,覆盖率高,说明我们的节省计划可能买多了,有节省计划闲置浪费了。如果是使用率低,覆盖率低,有可能是我们的节省计划买错了,节省计划和按量实例没有能够匹配上。
因此阿里云还提供了节省计划、购买推荐、下月预测等功能,可以帮助我们优化折扣产品。在购买推荐页面,我们可以输入节省计划的类型、购买时长、付费类型,系统会根据过往的实例账单自动推荐每小时的承诺消费金额,并且给出预期节省幅度以供参考。下月预测可以查看预估未来一个月对应云产品节省计划的使用情况,以及优化建议内容与方案。
第三,架构优化。在保障应用稳定性的前提下,通过优化架构升级能够在更大的范围内去降低整体云服务的使用成本。常见的架构优化策略有,通过架构全面云原生化组建成本最优的云服务使用模式,还有通过离在线混步技术,提升整资源的整体利用率,降低成本。还有通过Serverless化架构提升应用研发效率,收获良好的成本效益。
这里是我总结的一些其他降本增效的方法。
∙ 对于抢占式实例,可以借助弹性供应、弹性伸缩产品实现算力集群的稳定交付。具体弹性伸缩的内容,后面会做更详细的讲解。
∙ 对于按量付费实例,如果没有使用又不想立即释放的,可以开启节省停机模式。也可以借助自动化运维工具,OOS实现周期性的定时开关机。
∙ 对于包年包月实例,可以通过开启自动续费,统一到期日等,简化生命周期的维护。如果包年包月实例不再使用,也可以退订或者转按量付费。此外,还可以借助我们的成本优化工具,授权智能顾问产品定期扫描自身资源,给出成本优化的建议,借助用户中心成本分析功能进行费用分析与优化。
4) 客户案例
下面来看两个在成本优化方面的客户案例。
第一个客户案例来自于深势科技。它是一家药物研发算法科技公司,致力于通过技术解决药物研发的难题,实现药物分子的理性发现和设计。
客户上云的痛点主要有以下三个:
∙ 业务波动量比较大,希望可以提供基于作业负载的弹性伸缩能力,最大化的利用计算资源。
∙ 希望有效的调度集群的计算资源,能够提供跨可用区、多规格实例的弹性扩容。
∙ 作为一家初创企业,追求高性价比,希望能够以较低的成本完成有效的计算。
客户的痛点主要集中在算力需求、灵活性、成本三方面。在资源规格方面,推荐使用GPU服务器GN7,使得模型训练和推理的效率提升2-6倍。在成本和灵活性方面,使用了弹性供应的成本最优调度策略来调度抢占式实例。指定多个可用区和实例规格,确保以最优的价格完成抢占式资源的交付,最终以30%的成本完成日均3w+ vCPU资源的交付。
第二个客户案例来自于汇量科技。它是一家全球应用开发者技术服务平台,专注于提供移动互联网广告和数据分析服务。
客户的痛点主要有以下两点:
∙ 降本和技术需求,广告投放业务每日所需要的云成本资源波动巨大,是典型的弹性场景。
∙ 性能需求,广告推理服务金牌模块对于算力需求比较高。
我们的解决方案是在资源规格方面使用了第八代倚天云实例g8y,实现了同时提升CPU性能和内网带宽。与g6系列对比,单机成本降低15%-20%,综合性价比提升了30%以上。
通过结合ESS弹性伸缩服务和抢占式实例产品,在高峰期时及时开放资源,在低峰期时缩减资源。保障资源使用率在一个合理的水平,从而确保了成本的最优化。稳态的业务从包年包月转成按量+节省计划的购买形式,在成本进一步优化的同时,业务的灵活性也得到了很大的保障。
更多精彩内容,欢迎观看:
带你读《云上自动化运维宝典》——ECS省钱指南来啦!万字长文教你如何选择与业务形态最匹配的付费方式(3):https://developer.aliyun.com/article/1405381