阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘

简介: 在5月16日的飞天技术会新品直播中,特别邀请了业界知名大咖狒哥以及阿里云虚拟化资深专家旭卿作为现场直播的嘉宾。本次直播主要从产品背景到“X-Dragon架构”,从硬件设备到软件应用来深度的剖析“X-Dragon架构”为弹性计算裸金属服务器提供的极致计算能力。

在5月16日的飞天技术会新品直播中,特别邀请了业界知名大咖狒哥以及阿里云虚拟化资深专家旭卿作为现场直播的嘉宾。本次直播主要从产品背景到“X-Dragon架构”,从硬件设备到软件应用来深度的剖析“X-Dragon架构”为弹性计算裸金属服务器提供的极致计算能力。
数十款阿里云产品限时折扣中赶快点击这里领券开始云上实践吧!
直播视频请点击
以下为精彩视频内容整理:

产品背景

这几年越来越多的大客户把自己的业务搬到云上来,一方面是因为云可以在成本、效率、性能方面提供更多的优势。但在客户把业务往云上搬的过程中,可以看到客户对物理机产品的一个诉求,尤其是当客户的业务运营在线下物理机上时。在把业务搬上云的过程中,会遇到一些困难,遇到困难后有一些云计算公司可能就会推出一些物理机托管的服务,而这种服务很难满足客户的需求。所以我们考虑生产一个既兼具物理机的性能同时又能提供虚拟机体验的一款产品,基本是沿着这条思路做下来的。

揭开神龙的神秘面纱

_1


神龙(X-Dragon)又名弹性裸金属服务器,X-Dragon服务器是真正的从云计算的角度去设计的一款服务器,随着近几年云计算的热潮的到来,发现通用的CPU不能很好的满足客户的需求,所以我们就开始自己定制CPU。刚开始定制的时候大家可能真正关心的是核数、频率、size的大小等,但真正的分析业务后发现只有这些是不够的。举个例子就知道我们是在做什么工作了,比如在云计算数据中心里面虚拟机的热迁移是个非常重要的部分,它可以在马上要发生故障的时候把上面的虚拟机无感的迁移到其他的物理机上。但在迁移的过程中CPU和CPU之间可能存在着差异,在这种情况下怎么能够更好的去支持热迁移,我们会在CPU里面加入一些特定的部分,来解决掉这方面的问题,这些东西可能就是阿里巴巴所特有的。
我们又增加了6149这个型号,6149是16核的,并且是高主频的,所以高主频它的频率要比一般的CPU频率要高一些。为什么我们要做这个,其实当更多的企业级客户或者说大客户上来的时候,他们的一些应用对CPU单核性能的这种极致的追求是非常强的,所以我们最终决定在这一代加入比如说高主频的这样一个东西。
对于自研主板主要是因为从2014年开始随着客户不断上云,我们发现在使用一些业界的X86的主板没办法更好的满足需求,所以主板我们是完完全全的自研,这个主板的所有IP属于阿里巴巴完全自主设计。

X-Dragon MOC卡实例

_2


CPU和主板并不是神龙最特殊的地方,但MOC卡就是神龙的灵魂所在了,这个就是神龙技术架构的核心。这个卡就是完完全全由阿里巴巴自主设计,然后找硬件帮我们代工。它也有比较丰富的对外接口,它远远不是一个芯片,它上边有计算资源、有存储资源还有网络资源。从虚拟化的角度定义了一个这样的设备,这台设备就像虚拟机一样方便灵活,所以从它里边的一些组件一些部件能够和软件深入的融合在一起,把这样一台机器变成和虚拟机一样的用户体验。

X-Dragon架构的优势

它是可以分钟级的去创建100%物理机性能和功能的云服务器,所谓分钟级创建就是说,我们知道传统的物理服务器在交付的时候时间可能非常的长,所以大家喜欢云计算,用虚拟机的技术在几分钟之内就可以交付。我们要求X-Dragon具备100%的虚拟机的体验,比如说虚拟机的一切特性像资源弹性、自动化运维、无缝上云等。因为是物理机所以具有硬件隔离和极致安全。它是阿里巴巴自研的软硬件体系,是可信可控的。

X-Dragon架构自研硬件体系

_3


这几年云计算发展起来之后,自研可信可控是最基本的要求,所以整个的神龙的软硬件体系都是完全通过自研模式去实现的。第一个是神龙芯片,神龙芯片是整个设备的一个核心,因为通过它可以让这台设备完完全全具有虚拟机的特性,包括虚拟机的接口。神龙MOC卡在神龙的整个架构里具有比较重要的作用,它有比较丰富的接口、管理的接口、对外数据的接口可以帮助我们实现弹性裸金属服务器具备的这些功能。

X-Dragon MOC卡架构详解

_4


上图可以清晰的描绘出X-Dragon MOC整个的架构详解。上边是弹性裸金属的一个实例,它里边有CPU、内存,并且CPU、内存都是物理的,物理的优势就是物理机具备的特性它都具备。但下边是VirtlO-NIC、VirtlO-Blk,之所以这么做是希望云上的所有镜像、云上的所有系统、虚拟机和物理机之间完全兼容。除了这些功能外,还要一些外部设备,外部设备就是键盘、鼠标、显示器也是通过芯片、通过设备的形势模拟出来。这样就可以实现和虚拟机一样的对外接口,使得运营的操作系统不需要做任何的修改,在虚拟机上拿过来在X-Dragon MOC卡上直接用。下面这部分是卡的中心结构,整个X-Dragon Hypervisor完完全全运行在这张卡上面。它是支持云盘、支持VPC网络、支持存储/网络设备热插拔、支持32块弹性物理网卡同时对X86、ARM、Power等CPU是兼容的。

X-Dragon 自研软件体系

_5


在软件体系里硬件也扮演着重要的作用,所有的软件和硬件做到了整体的深度融合。所谓深度融合就是比如说X-Dragon芯片可能向上需要提供Virtio 网络驱动的接口、Virtio 存储驱动的接口、交互IO层驱动的接口,能让上边的实例具备虚拟机一样的体验。向下要和X-Dragon Hypervisor系统软件融合在一起,云盘要提供更佳极致的性能。

X-Dragon架构支持第三方虚拟化

_6


这是X-Dragon Hypervisor 的一个系统软件,可以从三个部分来讲:
  • 第三方虚拟化:在这样一个产品上其实可以很好的去运行这些虚拟化的软件,要比单纯的在物理机上运行要好很多。不用关心存储的可靠性等问题,因为神龙完全已经解决掉了。也不需要再去做网络的虚拟化,因为提供的32个网卡接口已经完全和阿里云网络虚拟化的基础设施相打通。
  • AnyStack:整个阿里云的Stack是基于飞天的Stack,能够更好的在公有云上和专有云上提供服务。以前OpenStack和ZStack是一种并列的关系,但是在有了神龙技术架构之后无论是OpenStack、ZStack、CloudStack 都能更好的和阿里云的基础设施连在一起。他们可以基于神龙云服务器去搭建自己的Stack,也可以使用阿里云的弹性裸金属服务器进行扩展。
  • 容器:在容器这一块列举了三个容器,这些容器都可以无缝的运行在上边。容器运行在云平台上的时候,传统方法是把容器运行在虚拟机里,但运行在虚拟机里容器的很多体验就会受到限制。我们提供X-Dragon云服务器之后,它不仅能提供像物理机一样的体验,并且它可以支持云盘、支持VPC的网络接口之后,每一个容器可以更好的应用弹性网络的接口通过VPC和整个的云基础设施其他的产品打通。

基于X-Dragon架构的阿里云弹性裸金属产品家族

_7


这是一个基于X-Dragon架构的阿里云弹性裸金属产品的性能表。目前,基于神龙架构的弹性裸金属服务器已正式商业化售卖,支持8核、16核、32核、96核等多个CPU规格,并支持3.7 GHz~4.1 GHz的超高主频实例。

AWS测试款对比

_8


现场同档规格实例的性能测试中,基于神龙架构的阿里云弹性裸金属实例ebmhfg5.2xlarge(8vCPU) 在10000位圆周率计算Superπ中跑出了1分26秒的成绩,比AWS基于Nitro架构计算型实例c5.2xlarge(8vCPU)快了15%。

总结

今天终于能在这里把神龙的技术架构做一个详细的介绍,在未来神龙这样一个技术架构会变成弹性计算核心的硬件发展体系,在这样一个体系里边未来的1.0、2.0、3.0其实能够提供更佳极致的产品级的体验。所以沿着这条道路走下去会不断的推出神龙的技术架构,不仅仅是今天这样的一个弹性物理机,未来还会有很多基于神龙架构的产品。

本文由云栖志愿小组陈欢整理,百见编辑
了解更多裸金属服务器(神龙)的精彩内容请点击:https://promotion.aliyun.com/ntms/act/ebmi.html

相关文章
|
2天前
|
弹性计算
阿里云2核16G服务器多少钱一年?亲测价格查询1个月和1小时收费标准
阿里云2核16G服务器提供多种ECS实例规格,内存型r8i实例1年6折优惠价为1901元,按月收费334.19元,按小时收费0.696221元。更多规格及详细报价请访问阿里云ECS页面。
26 9
|
2天前
|
弹性计算 异构计算
2024年阿里云GPU服务器多少钱1小时?亲测价格查询方法
2024年阿里云GPU服务器每小时收费因实例规格不同而异。可通过阿里云GPU服务器页面选择“按量付费”查看具体价格。例如,NVIDIA A100的gn7e实例为34.742元/小时,NVIDIA A10的gn7i实例为12.710156元/小时。更多详情请访问阿里云官网。
26 2
|
8天前
|
存储 弹性计算 NoSQL
"从入门到实践,全方位解析云服务器ECS的秘密——手把手教你轻松驾驭阿里云的强大计算力!"
【10月更文挑战第23天】云服务器ECS(Elastic Compute Service)是阿里云提供的基础云计算服务,允许用户在云端租用和管理虚拟服务器。ECS具有弹性伸缩、按需付费、简单易用等特点,适用于网站托管、数据库部署、大数据分析等多种场景。本文介绍ECS的基本概念、使用场景及快速上手指南。
37 3
|
12天前
|
监控 网络协议 安全
DNS服务器故障不容小觑,从应急视角谈DNS架构
DNS服务器故障不容小觑,从应急视角谈DNS架构
34 4
|
12天前
|
机器学习/深度学习 监控 Serverless
无服务器架构(Serverless)
无服务器架构(Serverless)
|
13天前
|
存储 弹性计算 编解码
通过阿里云的活动租赁云服务器时如何选择实例规格?选择指南参考
新手用户通过阿里云的活动租赁云服务器的时候实例规格应该怎么选?目前在阿里云的活动中,可选的云服务器类型除了轻量应用服务器之外,云服务器的主要实例规格有经济型e、通用算力型u1和计算型c7与c8y、通用型g7与g8y、内存型r7与r8y等实例,但是对于新手来说,由于是初次购买,实例规格往往不知道怎么选择了。本文为大家展示阿里云目前活动中各云服务器实例规格性能、适用场景以及选择指南参考。
|
17天前
|
弹性计算 开发框架 .NET
阿里云服务器购买教程及云服务器地域、实例、操作系统、带宽等参数选择指南
对于初次购买阿里云服务器的用户来说,想使用阿里云服务器搭建网站或者运行APP、小程序等项目,第一步就是要先购买阿里云服务器,下面小编以图文形式给大家介绍一下阿里云服务器的购买流程,以及购买过程中如何云服务器地域、实例、带宽等关键配置和选择这些参数的一些注意事项,以供参考。
|
2天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
|
3天前
|
弹性计算 Kubernetes Cloud Native
云原生架构下的微服务设计原则与实践####
本文深入探讨了在云原生环境中,微服务架构的设计原则、关键技术及实践案例。通过剖析传统单体架构面临的挑战,引出微服务作为解决方案的优势,并详细阐述了微服务设计的几大核心原则:单一职责、独立部署、弹性伸缩和服务自治。文章还介绍了容器化技术、Kubernetes等云原生工具如何助力微服务的高效实施,并通过一个实际项目案例,展示了从服务拆分到持续集成/持续部署(CI/CD)流程的完整实现路径,为读者提供了宝贵的实践经验和启发。 ####
|
2天前
|
缓存 监控 API
探索微服务架构中的API网关模式
随着微服务架构的兴起,API网关成为管理和服务间交互的关键组件。本文通过在线零售公司的案例,探讨了API网关在路由管理、认证授权、限流缓存、日志监控和协议转换等方面的优势,并详细介绍了使用Kong实现API网关的具体步骤。
11 3