目录
IaaS 层是私有云建设的最基础和核心的部分,资源池的架构与资源使用模式的“云化”同等重要。
私有云的容量怎么评估?成本怎么计算合理?如何才能达到成本和效率的平衡?
背景
目前主流私有云参考架构主要包含三个层次: IaaS 层、PaaS 层以及云管理平台
,企业进行私有云改造应该根据自己的实际需求逐步落地;
IaaS 层是私有云最核心和最基础的部分
,也是企业 IT 云化应该首先着手的部分。
云化不仅要解决计算、存储等资源自助和自动交付,更要解决传统架构带来的资源池分离、维护复杂,无法弹性扩展等问题。
私有云架构
私有云架构层次结构:
- IaaS 层
- Paas 层
- 服务管理平台
- 云用户界面层
做几点简单的归纳。
对于绝大部分企业私有云,无需 SaaS 层建设
在我们熟悉的云服务模型中,包含了三个层次(IaaS、PaaS、SaaS),其中 IaaS 层的服务对象是 IT 管理员,PaaS 层的服务对象是软件开发者,SaaS 层的服务对象是终端用户。
但企业私有云的主要服务对象是 IT 管理员以及软件开发者,IT 管理员更关注如何简化资源交付,基础架构管理与监控以及自动化运维等;而软件开发者更关注开发效率,持续、快速应用交付等,因此在企业私有云 SaaS 建设并不是必须的,而取而代之的是综合自助门户、自动化运维、资源监控与管理功能的云管理平台。
PaaS 层建设可以是循序渐进的,不必被“全栈”绑定
PaaS 平台核心价值在于帮助软件开发者摆脱 OS(操作系统)、Middleware(数据库、中间件)、Runtime(运行环境) 的安装、配置、维护、升级等繁杂的工作,使得开发者和企业用户把目光放到开发出色的应用程序上,帮助企业用户缩短程序开发与发布流程。但PaaS平台何时引入,以及如何引入仍然是需要企业仔细评估。
IaaS 层是私有云建设的最基础和核心的部分,资源池的架构与资源使用模式的“云化”同等重要。
IaaS 平台有效地屏蔽了硬件的复杂性,无论是 Paas 层还是管理平台都是建立在 IaaS 层之上的,整个私有云的可靠性、性能以及弹性都首先来自于IaaS层这个“基石“,所以,在私有云建设中,IaaS 层建设与改造都是最核心、最关键的工作。
然而 IaaS 层的建设也是最为复杂的,需考虑软、硬件以及物理环境等众多复杂因素。将 IaaS 层进一步拆解,实际上 IaaS 由物理硬件层,虚拟化层以及 IaaS 应用层组成。原理上是将服务器、网络、存储等基础架构硬件设备进行虚拟化,形成基础架构资源池后,配合各种 IaaS 应用对上层交付基础架构服务。只有完成 IaaS 层的建设,才有 PaaS 和云管理平台的施展空间。
客户诉求
业务更“敏捷”的需求
企业在传统的 IT 架构下,用户基于业务系统的资源需求,独立采购软件和硬件设备;一般需要经历:预算-测试-招标-采购-部署-应用上线等流程,整个过程复杂、耗时,很难做到业务快速上线的目标。企业用户对私有云的一个核心诉求是:资源可方便地进行交付,引入更多自动化功能帮助企业缩短业务系统的部署与发布流程,使企业在竞争中获得更大的优势。
业务更“稳定”的需求
企业中有越来越多的业务系统被要求提供 7*24 的不间断服务,事实上,数据中心一直面临着各种风险和挑战,包括停电、网络故障、硬件故障等问题都有可能影响业务的可用性。特别在传统架构下,随着 IT 规模增大,数据中心引入了更多不同的设备以及技术,增大了运维的复杂性,使得企业的 IT 管理员经常上演“消防员”角色,即便是这样也难以达到“不间断”运行的目标。因此企业构建私有云另外一个重要诉求是:私有云应该具备更简单的运维,更高的容错性,甚至是一定程度的故障自愈功能;支持远程站点的灾备方案,甚至是本地与“多云”之间的容灾。
资源交付更具“弹性”的需求
在传统架构中,基础架构资源往往是基于某个业务系统上线而建立,与业务系统有比较强的耦合关系,资源之间无法流动,容易造成资源孤岛以及资源利用率较低等问题。另外一个的问题来自于资源建设缺乏通盘的考虑,导致管理与扩展成本比较高。企业用户对私有云的另外一个期许是:改变原有将零散资源进行统一纳管的思路,建设统一资源池,实现更灵活的资源划分与交付;资源应具备“弹性伸缩”特性,可对资源进行生命周期管理,既可迅速扩展资源规模,也可以及时回收“闲置”资源进行重分配。
公有云和私有云的区别
区别 1:从云的建设地点划分,
- 公有云——互联网上发布的云计算服务,搭建云的资源在提供商的场所内;
- 私有云——
企业内部(专网)发布的云服务,搭建云平台所需的资源由企业自给
。区别 2:从云服务的协议开发程度划分,
- 公有云——协议开放的云计算服务,不需要专有的客户端软件解析。所有应用都是以服务的形式提供给用户的,而不是以软件包的形式提供。
- 私有云——
一般需要特定软件
。区别 3:从服务对象划分,
- 私有云——
- 为“一个”客户单独使用而构建的,因而提供对数据、安全性和服务质量的
最有效控制
;- 该公司拥有基础设施,并可以控制在此基础设施上部署应用程序的方式;
私有云可部署在企业数据中心的防火墙内
,也可以将它们部署在一个安全的主机托管场所;- 私有云可由云提供商进行构建,通过托管模式,构筑一个公司企业数据中心内的专用云。
- 而公有云——则是针对外部客户,通过网络方式提供可扩展的弹性服务。
私有云提供的能力
- 基础结构即服务 (IaaS),它允许公司使用基础结构资源,如计算、网络和存储即服务。
- 平台即服务 (PaaS),它允许公司提供各种应用程序,小至基于云的简单应用程序,大到复杂的企业应用程序。
- 私有云还可与公有云结合创建混合云,允许企业利用云爆发,以便释放更多空间并在计算需求增加时将计算服务规模扩展到公有云。
国内私有云演化阶段
私有云1.0 – 基于VMware构建的私有云
私有云1.0是基于VMware vSphere、SAN存储和物理网络等构建的企业私有云。
下图是一典型政企单位的单IDC中的私有云架构。
这种私有云的优势很明显,
稳定、强安全隔离、强控制。
但其缺点也非常明显,主要有:
- 实际上只是虚拟机,还不能称为真正的云,只能提供虚拟机和磁盘。
- 成本高。SAN存储网络设备和存储设备都架构高昂。VMware license费用也很高。
- 管理成本高,而且资源池无法打通,每个竖井的资源利用率不均衡,无法充分通过池化来利用资源。
- 只能满足稳态应用的需求,无法满足敏态应用的需求。
- 不能自服务交付,交付周期长。
私有云2.0 – 基于OpenStack构建的私有云
此时代的发端标志是OpenStack在2010年兴起,成熟标志是OpenStack私有云在2013年左右开始承载政企单位的生产系统,并在2015年左右达到发展顶峰。
以下是以 OpenStack 为中心构建私有云的架构图。
由于 OpenStack 本质上是一个 IaaS 的框架,需要结合其他的软件才能完成 IaaS 层的构建 ,通过下图展示 OpenStack 方案的组成。
通过上图可以看到 :
- OpenStack 本身不直接提供服务虚拟化、存储、网络等功能。
- OpenStack Nova 计算组件负责对接 Hypervisor 软件,如:KVM、VMware vSphere、XenServer 等,实际上由 Hypervisor 提供服务器虚拟化功能。
- 存储方面可能选择的方案包括 SDS、传统集中式存储等。
私有云2.0时代的主要特征:
- 企业IDC进入云时代,虚拟化时代成为过去。云的显著特征之一是自服务。此时代的私有云提供和公有云控制台类似的私有云控制台,结合企业审批流程,用户自助申请资源并能在比较短的时间内获得云资源。
- 技术上,采用OpenStack的分区隔离方式。单个集群规模通常不超过500台服务器,通常采用多云管理平台来管理多个集群。除了原有SAN存储区外,部分企业采用基于Ceph的二级存储区域。
- 应用直接从1.0私有云环境几乎能不做任何修改地迁移到新私有云环境之中。
OpenStack缺点
OpenStack集群几乎无法升级,无法下线,很难迁移,维护成本越来越高,只能提供有限的服务。
私有云3.0 - 基于公有云厂家的专有云构建的私有云
私有云3.0是基于公有云厂家的专有云构建的大型私有云。
新一代私有云,采用由公有云厂家提供的基于其公有云架构的专有云产品,以公有云部署架构在客户数据中心内进行部署。
- 阿里云专有云(ApsaraStack)
- 腾讯云TCE(Tencent Cloud Enterprise)
- AWS 的 AWS Outposts
- 华为云的Stack Online
总结
在国内,企业主要通过 3 大途径落地私有云:
- 将AWS、Azure、阿里云等商业公有云方案全套落地到私有环境;
- 使用类似 OpenStack、Ceph 等开源软件构建私有云;
- 使用类似 VMware、SmartX、Nutanix 等虚拟化或超融合产品配合 CMP 组件等成
开源解决方案
产品名 | OpenStack | ZStack 社区版 | Nano |
开源地址 | https://www.openstack.org/ | https://www.zstack.io/product/zstack_cloud_enterprise/ | https://nanos.cloud/ |
内容介绍 | Openstack 可以 控制着大量的计算、存储和网络资源池, 所有这些资源都通过 API 或仪表板进行管理。 除了标准的基础架构即服务功能之外, 其他组件还提供编排、 故障管理和服务管理以及其他服务, 以确保用户应用程序的高可用性 | 国内自主研发的非OpenStack私有云的架构 ZStack Cloud 社区版为社区用户提供功能完备的私有云平台, 提供云主机、VPC路由器、云盘、 快照、镜像、计算规格、云盘规格等功能。 | 基于KVM技术,使用Go语言开发, 简单易学的虚拟机管理软件, 从Web管理门户、主机监控、镜像克隆 到故障切换,功能完备,开箱即用, 数分钟之内即可将您的服务器集群升级为云主机平台。 |
安全可靠性 | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
资源监控 | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
实例管理 | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
扩展性 | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
搭建复杂度 | 难度大 | 相对简单 | 相对简单 |
效果
OpenStack
ZStack 社区版
Nano
商业解决方案
产品名 | 阿里云专有云 | 腾讯云TCE | AWS Outposts | 华为云的Stack Online | ZStack | 青立方QingCloud | 滴滴云 |
地址 | https://apsara-stack.aliyun.com/?product=qiyeban | https://cloud.tencent.com/solution/tce | https://aws.amazon.com/cn/outposts/pricing/ | https://www.huaweicloud.com/product/huaweicloudstack.html | https://www.zstack.io/thesolution/calculator/ | https://www.qingcloud.com/products/hyper-converged-hardware/ | https://www.didiyun.com/production/privatecloud.html |
特性 | 规模按需(多规模、多地区云平台) 安全稳定(两地三中心容灾、异地多活方案) 一应俱全(本地可使用阿里云产品,可弹性扩展至公共云) 一站式服务(交付、部署、迁云、运维、培训等) | 提供一站式解决方案(从软件到硬件) 多地多数据中心多活分布式架构 弹性交付,灵活定制 | 免费使用时间长,但收费坑比较多,且感觉收费贵 | 公有云能力,本地化部署 多级治理架构,智能运维 安全可信 将智能延伸到边缘 | 无缝升级 无硬件绑定 云平台高可用 功能丰富 | 性能领先 深度融合 优化的存储及计算密度 | 性能卓越(秒级响应、分布式存储) 安全可靠(备份、快照) 无缝扩展 |
售卖模式 | 产品订阅模式 传统商业采购形式 | 稳定快速、高效易用腾讯黑石TStack一体机柜 |
私有云建设的问题
云与虚拟化的区别是?云多了什么
问题描述:
1)达到什么样的硬件规模,才有上私有云的必要? 有几百上千那是上,有的10台 20台 也是上。每个企业可能衡量的标准不一样。怎么判断要不要上?
2)已有虚拟化的情况下,上云到底能带来什么样的帮助?云比虚拟化多了什么?
解答:
多了云服务,一种基础设施封装服务模式。虚拟化提供不了SAAS,PAAS,也提供不了计费、计量、服务开发和自服务定制。虚拟化只是一种比较方便支持云计算的一种技术手段,并不是云计算。
那么要不要上私有云?其实我们这里分析的是上私有云是有什么诉求,这些诉求是否值得投入,投入产出如何。在有资金和人力支持的情况下,基础设施利用现有的虚拟化进一步到云计算环境(还要考虑网络、存储、流程的投入),是可以的,但不是必须的,需要考虑自身成本、规模,量体裁衣。
私有云的容量怎么评估?成本怎么计算合理?如何才能达到成本和效率的平衡?
解答:
私有云的容量需要根据业务来评估:
以一般应用来说,有web区,有app,有db。需要根据运行在私有云上的业务的多少,来统计所需要的资源的多少。例如,web区,需要nginx,需要考虑HA和LB,那么就需要2台以上;如果多个业务共享nginx,那么就需要多个nginx来分担业务压力。 成本计算:一般私有云平台上,都有一个celimeter这个模块,专门用来计量CPU,内存,网络的使用量,可以统计出使用私有云的资源,相对传统环境节省了多少资源。
至于成本和效率的平衡,一般在私有云建设初期很难做到。设备的购置,部署,人员的配置等等都是一笔不小的开支;私有云真正的优势体现,应该在后期的使用中容量如何评估,这个肯定是没有普适标准的了。
容量通常从三方面考虑:计算能力、存储容量、网络带宽。这三方面可以说也是数据中心最基本的三大核心要素了,我们都知道,云计算是以规模取胜的,这个规模如何决定?究竟是20节点,50节点,还是100+节点,这个得根据你自己的业务需求来考虑了,在小规模情况下,为了高可用,如果可用容量评估是N,那你就按2N来计算,私有云一般不会像达到公有云那种规模,所以通常也不可能达到很多布道师口中的 虚机随便挂,真挂了你宿主机资源没有了,咋整?
至于成本,得看你的方案了,你是采用开源自建,还是与厂商合作共建,合作情况下如何分工,哪些外包出去,这个你得仔细考虑。通常,如果人力资源有限,技术实力有限,那就由承包给厂商来实施吧,不然到后面也是个烂摊子。但是,全部外部给厂商的不足也是明显的,一不小心你就被锁定,每年烧钱的跑不掉的了,尤其是项目上马后,停也停不下来了。
上云之后对IT部门的架构有什么样的影响?
解答:
云计算使传统意义上的数据中心从原来的成本中心转变成服务中心,支持向公司内部输出规范的、有质量保证的服务,降低服务成本、运营成本的同时促进IT部门运维模式发展变革,简化系统建设、运维工作,提升工作效率。
云计算有其独特的价值:
缩短上线周期:
云计算的引入能够显著缩短硬件资源、平台环境、应用系统的部署周期,支持各部门在最短时间内以“随需即取”的方式获取系统部署所需的一切服务资源,运维管理团队即可根据服务模板实现远程快速部署和动态调整,减少重复性建设工作,支撑业务的快速发展变化。
进一步实现绿色节能:
云计算构建于池化的硬件资源基础上,并进一步实现服务化封装及更高层级的细粒度服务复用,从而相应降低对数据中心机房的电力、制冷、空间消耗,实现机房绿色节能。
促进运维模式发展变革:
针对业务需求部门提供自助式服务,需求部门依据定制的云服务目录选取所需的计算资源、存储空间、网络服务、基础平台环境等服务项并提交申请,运维管理团队根据定制成型的服务模板,依靠自动化技术及云管理平台来交付规范的、有质量保证的服务,将传统运维模式转变为以服务为中心的方式,降低系统建设、运维、管理工作量。
参考链接:
https://www.redhat.com/zh/topics/cloud-computing/public-cloud-vs-private-cloud-and-hybrid-cloud
https://www.redhat.com/zh/topics/cloud-computing/what-is-cloud-management