带你读《企业数字化基石-阿里巴巴云计算基础设施实践》第二章TOC建模2.3TCO最优

简介: 《企业数字化基石-阿里巴巴云计算基础设施实践》第二章TOC建模2.3

2.3  TCO最优

在满足业务性能要求的前提下,如何做到总体TCO最优,包括CapExOpEx总体最优,是业务关注的核心问题。TCO最优不仅要考虑产品本身的CapEx OpEx,还要考虑业务产品的市场竞争力,能够将业界最先进的产品和技术快速应用于上层业务中,充分挖掘技术红利。

因此,对最终用户来说,如何提供满足业务需要的计算、存储解决方案是非常大的挑战。我们需要能够根据不同业务特点,提供最适合业务诉求的解决方案,不仅包括计算、存储、网络等,也包含实现方式,是选择自建数据中心,还是选择混合云部署,或是完全放在公共云上。

从全世界范围内云计算的实践来讲,公共云已经深入人心,并在切实地推动各个行业的数字化转型。公共云是一种商业,更是一种基础设施的资源,客户从公共云厂商买的不是设备,不是机房,而是 IT能力,让更专业的云服务商来做基础计算、运营维护的工作。

从财务的角度来看,自建基础设施和使用公共云计算,就类似于 CapEx OpEx的区别。从企业经营的角度看,CapEx一次性投入大,不确定性强,且由于 IT设备的生命周期所限,技术研发也必须跟上投入,而 OpEx支出稳定,按需付费,不浪费资源,所以企业更倾向于将CapEx转为 OpEx,改善企业的现金流,这种逻辑不论对中小客户还是企业级客户,都是成立的,其本质是将CapEx投资的风险转嫁给公共云服务商,而对自己就是财务最优的配置。风险本身在于该公共云服务商体量是否够大,是否能够持续发展,是否能够提供稳定可靠的大规模服务,因此很多决策者选择头部公共云服务商,也是这个考量。

另外一个考量是稳定性,用户关注服务的不间断性,而公共云厂商提供的就是永不停机的计算服务,这是自建基础设施无法达到的,在省钱的基础上保证服务的永续。所以公共云计算永不停机,让客户降低了服务中断的损失,也是成本的降低。因此,最终用户在考虑如何搭建基础设施满足业务需求的时候,不仅考虑物理成本、运维成本,同时还需要关注资源利用效率、弹性、扩容效率和能力,以及容灾成本等全链条的综合因素。

例如,图 2-5描述了一个通常的资源规划,平时日常需求计算量小,但一旦有新特性上线、营销活动、大促等,就必须要有足够的资源满足业务需求。这其实非常典型地反映了现代企业对计算资源需求的两个趋势——长期的向上增长,以及突然的爆发。在过去 20年中,阿里巴巴是典型的企业代表,深切地感受到这一点。在没有云的时候,公司技术架构只能自建 IT  基础设施,需要有非常前瞻性的规划,如在前一年就要规划好后一年的容量规划,既能满足业务的需求,又不能过于超前,让基础设施产生大量闲置。

image.png

一般企业技术部门经历的实际情况是,为了满足业务的高峰需求,必须多买设备,即使这些设备很多时候只能闲置,同时,业务的增长速度和时点往往会超过所有人的估计,很多时候会击穿资源的上限,造成服务中断或延误。这样,计算力的曲线和业务的曲线永远是一对矛盾,企业当然希望两者之间差别越小越好,但实际的生产中要么发现 CPU利用率极低,要么资源被打爆。原因来自两个方面 :业务的增长很多时候是无法预测的,业务的需求并不是线性的,很多时候会因为促销或者过节而大幅度波动。

自建基础设施面临的问题是随着规模扩大,边际成本很难降低,而容灾成本急剧提升,在使用公共云的情况下,可以获得由于极大规模带来的直接红利,使得基础设施的资源成本可控,同时可以弹性使用资源,因此平均使用成本保持不变,同时不为用不上的资源付费。

在涉及具体业务扩容的实际场景中,随着服务器规模的增加,扩容和容灾的成本不可避免地由于网络架构的扩张 /升级、数据中心的扩张,甚至地域的扩张而在不同阶段存在阶梯式的上升,如图 2-6所示。公共云的出现实际上解决了不同规模的云成本。

image.png

2-6资源规划

     IT基础设施扩容及容灾的成本上升问题,让大规模的扩容及容灾成本也能维持在稳定的低位上。这就是在业界很容易被忽略的一个概念,即广义的弹性,指的是云规 模的预铺设带来的普惠和低边际成本扩容。当一个新用户拥抱公共云的时候,无论 是大客户还是小客户,享受的基础设施是相同的,这也是普惠技术这一概念的本质 所在,用户不用大规模的基础设施投资,就可以马上享受到两地三中心、云灾备、高弹性等昔日银行、电信等大客户只有花费巨额投资才能享受到的技术能力。

因此,既要少花钱,又要享受新的硬件技术红利,还能保障资源的可供给性、足够的资源成本灵活度,甚至无须考虑运维复杂性和硬件稳定性,相对于自建数据中心,使用公共云实现全局最优的TCO已经成为越来越多用户的首选。


相关文章
|
28天前
|
存储 算法 调度
云计算环境下的性能优化实践
云计算环境下的性能优化实践
|
2月前
|
Kubernetes Cloud Native 持续交付
云计算的转型之路:云原生技术的崛起与实践####
【10月更文挑战第16天】 本文深入探讨了云原生技术在现代IT架构变革中的核心作用,不同于传统概述,本摘要将聚焦于云原生如何促进企业实现敏捷开发、弹性伸缩及高效运维,通过具体案例分析展现其在实际业务场景中的创新应用,揭示这一技术趋势对企业数字化转型的深远影响。 ####
50 2
|
1月前
|
云安全 存储 监控
云计算安全:AWS与Azure的安全策略与实践比较
【10月更文挑战第26天】本文详细比较了AWS和Azure在安全性方面的策略和实践,涵盖身份与访问管理、数据加密与保护以及安全监控与响应。通过代码示例展示了两家云服务提供商在实际应用中的具体操作,帮助企业在选择云服务时做出明智决策。
37 0
|
2月前
|
存储 安全 网络安全
云计算与网络安全:构建安全的数字基石## 一、
本文探讨了云计算与网络安全之间的紧密联系,强调在享受云服务带来的便利与效率的同时,必须重视并加强信息安全管理。通过分析云服务的基本概念、特点及面临的主要安全风险,提出了一系列增强网络安全的策略与措施,旨在为企业和个人用户提供一个更加安全、可靠的云计算环境。 ## 二、
|
25天前
|
人工智能 边缘计算 云计算
2024.11|云计算行业的商业模式创新方法及实践
截至2024年,全球云计算行业迈入全新阶段,从IaaS到大规模AI模型平台,技术与商业模式不断创新。本文分析全球最新技术进展,探讨云计算商业模式创新策略与实践,解析云服务厂商如何通过技术革新实现价值最大化,推动企业数字化与智能化转型。重点讨论AI与云计算的深度融合、边缘计算与去中心化发展、平台化与生态系统建设,以及数据安全与绿色云计算等关键议题。
80 30
|
16天前
|
云安全 监控 安全
云计算环境下的网络安全策略与实践
在数字化时代,云计算已成为企业和个人存储、处理数据的重要方式。然而,随着云服务的普及,网络安全问题也日益凸显。本文将探讨如何在云计算环境中实施有效的网络安全措施,包括加密技术、访问控制、安全监控和应急响应计划等方面。我们将通过具体案例分析,展示如何在实际场景中应用这些策略,以保护云中的数据不受威胁。
|
1月前
|
云安全 存储 监控
云计算安全:AWS与Azure的安全策略与实践比较
【10月更文挑战第27天】本文对比分析了AWS和Azure在云计算安全领域的策略与实践,涵盖技术、定价、混合云工具等方面。通过代码示例展示了如何在两个平台上实施安全措施,如监控告警、数据加密和身份管理。总结了两者的优缺点,帮助读者根据具体需求选择合适的云服务提供商。
43 4
|
12天前
|
监控 持续交付 API
深入理解云计算中的微服务架构:原理、优势与实践
深入理解云计算中的微服务架构:原理、优势与实践
26 0
|
2月前
|
监控 Linux 云计算
Linux操作系统在云计算环境中的实践与优化###
【10月更文挑战第16天】 本文探讨了Linux操作系统在云计算环境中的应用实践,重点分析了其在稳定性、安全性和高效性方面的优势。通过具体案例,阐述了Linux如何支持虚拟化技术、实现资源高效分配以及与其他开源技术的无缝集成。文章还提供了针对Linux系统在云计算中的优化建议,包括内核参数调整、文件系统选择和性能监控工具的应用,旨在帮助读者更好地理解和应用Linux于云计算场景。 ###
48 3
|
2月前
|
Cloud Native 持续交付 云计算
云端新纪元:探索云原生技术的奥秘在当今数字化时代,云计算已成为推动企业创新和增长的关键动力。随着云平台的不断成熟,云原生技术应运而生,以其独特的优势引领着一场新的技术革命。本文将深入探讨云原生的核心概念、主要特点以及它如何改变现代软件开发和部署的方式,为您揭开云原生这一神秘面纱。
云原生是一种构建和运行应用程序的方法,充分利用了云平台的弹性、分布式本质以及声明式基础设施。本文将解析云原生的十二要素,微服务架构的优势,以及容器化、持续集成与持续部署(CI/CD)等核心技术的实践应用。通过深入浅出的方式,让读者理解云原生不仅是一种技术,更是一种文化和方法论,它正在重塑软件开发流程,提高资源利用率和应用系统的可扩展性与容错性。