技术的演进总是螺旋式地上升和迭代的,对于计算单元的演进方向从物理机到虚拟机、容器,再到无服务器计算之后,随着虚拟化技术的演进,软硬件一体化的概念被进一步地实践落地。经过重新定义的裸金属不仅成为云计算底层的通用硬件方案, 而且产生了新的价值。
2.3.1 弹性裸金属服务器
阿里云于2017 年首次对外公布提供弹性裸金属服务器(ECS Bare Metal Instance)。这是一款同时兼具虚拟机弹性和物理机性能及特性的新型计算类产品,是基于其自主研发的下一代虚拟化技术而打造的新型计算类服务器产品。与上一代虚拟化技术相比,下一代虚拟化技术的主要创新在于不仅支持普通虚拟云服务器,而且全面支持嵌套虚拟化技术,在保留了普通云服务器的资源弹性的基础上,又借助嵌套虚拟化技术保留了物理机的体验。
弹性裸金属服务器融合了物理机与云服务器的各自优势,实现超强、超稳的计算能力。通过采用其自主研发的虚拟化2.0 技术,用户的业务应用可以直接访问弹性裸金属服务器的处理器和内存,无任何虚拟化开销。弹性裸金属服务器具备物理机级别的完整处理器特性(例如Intel SGX),以及物理机级别的资源隔离优势,特别适合在云上部署传统非虚拟化场景的应用。
弹性裸金属服务器通过自研芯片和自研Hypervisor 系统软件,以及重新定义服务器硬件架构等软硬件和芯片技术,打造了全球领先的深度融合物理机和虚拟机特性的创新型计算架构。弹性裸金属服务器开创了一种新型的云服务器形式,可以与阿里云38
产品家族中的其他计算产品无缝对接,例如存储、网络、数据库等产品,完全兼容云服务器ECS 实例的镜像系统,从而更多元化地结合业务场景进行资源构建。
弹性裸金属服务器可以进一步解决用户对高性能计算的强需求,更好地帮助用户搭建新型混合云。这款产品不仅具有虚拟机的灵活性和弹性,同时具备物理机的一切特性和优势,因此也具备再次虚拟化的能力,使得线下的专有云均可无缝平移到阿里云上,而不用担心嵌套虚拟化带来的性能开销,为用户上云提供了一种新途径。
2.3.2 超级计算集群
超级计算集群(Super Computing Cluster,SCC),简称超算,是基于弹性裸金属服务器并搭配高速RDMA 网络互联的CPU 及GPU 等异构加速设备,面向高性能计算、人工智能、工程计算、数据分析、音视频处理等应用,提供极致计算性能和并行效率的计算集群服务。过去超算都是建设在超算中心或者用户自己的IDC 内的,使用效率极低且弹性较差,而阿里云的弹性计算服务第一次将真正意义的超算搭建在了公共云上,让用户可以用到弹性、高性能的计算服务。同时,底层计算的并池,可以让超算集群的使用率大幅提高。例如平时可以承接普通计算任务的资源,当有超算任务时,在云上通过大规模的任务调度和海量的用户业务需求,进行资源搬迁就能实现。云端超算可以说是结合了弹性裸金属的新技术、云计算的大规模集中优势和超算这一传统典型场景的“老树发新芽”,为超算场景用户带来了更高的业务价值。