虚拟机云服务器具备很好的弹性,但是无法提供裸金属实例,很难满足客户的二次虚拟化需求,并且传统虚拟化性能损耗比较高。本节我们将开始介绍神龙弹性裸金属服务器(ECS Bare Metal Instance),它是阿里云首创的同时提供虚拟化和裸金属实例的技术。
弹性裸金属兼具“弹性”和“裸金属”两个属性,既具备虚拟机级别的弹性和使用体验,又保留了裸金属即物理机的优势,让它在很多场景中具有了独特的优势。要实现这两个属性,就需要最大限度地保持 VPC 网络、EBS 云盘、ECS 管控的技术和代码兼容性,并兼容服务器 IDC 上线和运维流程。
3.3.1 功能特点
传统的基于 IDC 托管的物理机服务,由于无虚拟化技术参与,所以很难实现资源池化、弹性供给和管理运维的自动化,无法满足云服务的业务需求,很难归类为云服务。图 3-15 对基于 IDC 托管的物理机服务和基于虚拟化技术的虚拟机服务做了对比。
弹性裸金属服务器这一新物种强调的是“弹性”,也就是通过技术创新,使得传统裸金属服务能够具有和虚拟机一致的使用体验和业务敏捷性。具体而言,它具备如图 3-16 所示的 8 项关键特征。
分钟级交付兼容VPC、SLB、RDS等云平台全业务兼容虚拟机镜像云盘启动和数据云盘动态热插拔物理机的性能和高隔离性虚拟机VNC、Web 控制台、Open API 用户体检宕机自动迁移恢复免人为自动化运维
图 3-16 弹性裸金属服务器的关键特征
特征一:分钟级交付
云服务快速弹性伸缩,是 IaaS 云服务的核心特征。一般来说,虚拟机服务可以做到分钟级业务的弹性伸缩。当业务流量瞬间暴涨时,要求后台必须具备分钟级业务弹性伸缩能力,弹性裸金属服务器只有做到分钟级快速交付,才能应对突如其来的业务流量。
特征二:兼容 VPC、SLB、RDS 等云平台全业务
对于已经上云的用户来说,出于保护当前投资等考虑,完全兼容现有云平台业务至关重要。以 VPC 网络为例,弹性裸金属服务器必须具备和虚拟机保持百分百一致的虚拟化网络接入能力和安全隔离能力。
特征三:兼容虚拟机镜像
兼容虚拟机镜像,可以使弹性裸金属服务器和虚拟机之间平缓迁移,提供业务部署弹性。
特征四:云盘启动和数据云盘动态热插拔
云盘启动是弹性裸金属服务器的核心特征。如果无法支持云盘启动,则必须依赖传统的 PXE 装机,而PXE 装机无法实现分钟级业务交付、控制台镜像和密码修复等关键功能。数据云盘动态热插拔是弹性存储服务的关键特征,保证用户对存储性能和容量需求能够“Pay-As-You-Go”(按量付费)。
特征五:虚拟机 VNC、Web 控制台、Open API 用户体验
保持和虚拟机 Web H5 VNC、Web 控制台等方面一致的用户体验,能够极大降低用户的学习成本;保持和虚拟机一致的 Open API 接口,才能保护用户对既有资源管理系统的投资。
特征六:宕机自动迁移恢复
宕机自动迁移恢复可以极大减少 IaaS 基础设施故障的恢复时间。当虚拟机或者弹性裸金属服务器出现软硬件故障时,运维管控系统能够自动迁移实例,保证用户业务中断最小化。
而宕机自动迁移恢复归功于弹性裸金属服务器本地“无状态”,其实现依赖 BIOS 配置可迁移、云盘启动、数据云盘等关键技术。
特征七:免人为自动化运维
传统物理机的部署一般需要 3 个工作日,交付时间长,而免人为自动化运维是 IaaS 云服务的核心特征。
特征八:物理机的性能和高隔离性
虚拟机同样具备上述七大特征,而弹性裸金属服务器在具备上述七大优势的同时,还必须具备虚拟机所不具备的核心竞争力,包括以下方面。
物理机的完整处理器特性
虚拟机无法提供 Intel VT-x 和 VT-d 等技术,而物理机天然具备这些完整处理器特性。缺乏 VT-x 等技术的支持,在虚拟机中进行嵌套虚拟化, 其性能是完全无法接受的。因此,对于在公共云上部署专有云等场景,如 OpenStack、VMWare、Clear Container 和 Runv 等,弹性裸金属服务器是唯一选择,同时也支持Intel vTune、性能调优和剖析依赖。
类似于 skylake AVX512 等新导入处理器的指令特性,弹性裸金属服务器无须等待 Hypervisor 适配即可在第一时间获得,并且由于没有 Hypervisor 软件适配的复杂性,其功能的稳定性得到天然保障。
物理机无损的高性能
虚拟化技术必然带来性能开销,而物理机不存在 CPU 和内存虚拟化开销,此方面有绝对优势。
物理机的高隔离性
物理机在 CPU、内存、I/O 等资源方面完全隔离,做到了真正意义上的资源零争抢。
物理机的高安全性
物理机是真正意义上的用户独占,对于诸如 Hypervisor 逃逸、CPU 微架构侧信道攻击等问题,天然免疫。
表 3-2 对弹性裸金属服务器、物理机和虚拟机的关键能力进行了对比。
表 3-2 弹性裸金属服务器、物理机和虚拟机的关键能力对比
功能分类 |
功能 |
弹性裸金属服务器 |
物理机 |
虚拟机 |
运维自动化 |
分钟级交付 |
Y |
N |
Y |
计算 |
无性能损失 |
Y |
Y |
N |
无特性损失 |
Y |
Y |
N |
|
资源无争抢 |
Y |
Y |
N |
|
存储 |
完全兼容 ECS 云盘系统 |
Y |
N |
Y |
使用云盘(系统盘)启动 |
Y |
N |
Y |
|
系统盘快速重置 |
Y |
N |
Y |
|
使用云服务器 ECS 的镜像 |
Y |
N |
Y |
|
物理机和虚拟机之间相互冷迁移 |
Y |
N |
Y |
|
免操作系统安装 |
Y |
N |
Y |
|
免本地 RAID、提供更高云盘数据保护 |
Y |
N |
Y |
|
网络 |
完全兼容 ECS VPC 网络 |
Y |
Y |
Y |
完全兼容 ECS 经典网络 |
Y |
Y |
Y |
|
物理机集群和虚拟机集群 VPC 无通信瓶颈 |
Y |
N |
Y |
|
管控 |
完全兼容 ECS 现有管控系统 |
Y |
N |
Y |
VNC 等用户体验和虚拟机保持一致 |
Y |
N |
Y |
|
带外网络安全 |
Y |
N |
N/A |