阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘

简介: 在5月16日的飞天技术会新品直播中,特别邀请了业界知名大咖狒哥以及阿里云虚拟化资深专家旭卿作为现场直播的嘉宾。本次直播主要从产品背景到“X-Dragon架构”,从硬件设备到软件应用来深度的剖析“X-Dragon架构”为弹性计算裸金属服务器提供的极致计算能力。

在5月16日的飞天技术会新品直播中,特别邀请了业界知名大咖狒哥以及阿里云虚拟化资深专家旭卿作为现场直播的嘉宾。本次直播主要从产品背景到“X-Dragon架构”,从硬件设备到软件应用来深度的剖析“X-Dragon架构”为弹性计算裸金属服务器提供的极致计算能力。
数十款阿里云产品限时折扣中赶快点击这里领券开始云上实践吧!
直播视频请点击
以下为精彩视频内容整理:

产品背景

这几年越来越多的大客户把自己的业务搬到云上来,一方面是因为云可以在成本、效率、性能方面提供更多的优势。但在客户把业务往云上搬的过程中,可以看到客户对物理机产品的一个诉求,尤其是当客户的业务运营在线下物理机上时。在把业务搬上云的过程中,会遇到一些困难,遇到困难后有一些云计算公司可能就会推出一些物理机托管的服务,而这种服务很难满足客户的需求。所以我们考虑生产一个既兼具物理机的性能同时又能提供虚拟机体验的一款产品,基本是沿着这条思路做下来的。

揭开神龙的神秘面纱

_1


神龙(X-Dragon)又名弹性裸金属服务器,X-Dragon服务器是真正的从云计算的角度去设计的一款服务器,随着近几年云计算的热潮的到来,发现通用的CPU不能很好的满足客户的需求,所以我们就开始自己定制CPU。刚开始定制的时候大家可能真正关心的是核数、频率、size的大小等,但真正的分析业务后发现只有这些是不够的。举个例子就知道我们是在做什么工作了,比如在云计算数据中心里面虚拟机的热迁移是个非常重要的部分,它可以在马上要发生故障的时候把上面的虚拟机无感的迁移到其他的物理机上。但在迁移的过程中CPU和CPU之间可能存在着差异,在这种情况下怎么能够更好的去支持热迁移,我们会在CPU里面加入一些特定的部分,来解决掉这方面的问题,这些东西可能就是阿里巴巴所特有的。
我们又增加了6149这个型号,6149是16核的,并且是高主频的,所以高主频它的频率要比一般的CPU频率要高一些。为什么我们要做这个,其实当更多的企业级客户或者说大客户上来的时候,他们的一些应用对CPU单核性能的这种极致的追求是非常强的,所以我们最终决定在这一代加入比如说高主频的这样一个东西。
对于自研主板主要是因为从2014年开始随着客户不断上云,我们发现在使用一些业界的X86的主板没办法更好的满足需求,所以主板我们是完完全全的自研,这个主板的所有IP属于阿里巴巴完全自主设计。

X-Dragon MOC卡实例

_2


CPU和主板并不是神龙最特殊的地方,但MOC卡就是神龙的灵魂所在了,这个就是神龙技术架构的核心。这个卡就是完完全全由阿里巴巴自主设计,然后找硬件帮我们代工。它也有比较丰富的对外接口,它远远不是一个芯片,它上边有计算资源、有存储资源还有网络资源。从虚拟化的角度定义了一个这样的设备,这台设备就像虚拟机一样方便灵活,所以从它里边的一些组件一些部件能够和软件深入的融合在一起,把这样一台机器变成和虚拟机一样的用户体验。

X-Dragon架构的优势

它是可以分钟级的去创建100%物理机性能和功能的云服务器,所谓分钟级创建就是说,我们知道传统的物理服务器在交付的时候时间可能非常的长,所以大家喜欢云计算,用虚拟机的技术在几分钟之内就可以交付。我们要求X-Dragon具备100%的虚拟机的体验,比如说虚拟机的一切特性像资源弹性、自动化运维、无缝上云等。因为是物理机所以具有硬件隔离和极致安全。它是阿里巴巴自研的软硬件体系,是可信可控的。

X-Dragon架构自研硬件体系

_3


这几年云计算发展起来之后,自研可信可控是最基本的要求,所以整个的神龙的软硬件体系都是完全通过自研模式去实现的。第一个是神龙芯片,神龙芯片是整个设备的一个核心,因为通过它可以让这台设备完完全全具有虚拟机的特性,包括虚拟机的接口。神龙MOC卡在神龙的整个架构里具有比较重要的作用,它有比较丰富的接口、管理的接口、对外数据的接口可以帮助我们实现弹性裸金属服务器具备的这些功能。

X-Dragon MOC卡架构详解

_4


上图可以清晰的描绘出X-Dragon MOC整个的架构详解。上边是弹性裸金属的一个实例,它里边有CPU、内存,并且CPU、内存都是物理的,物理的优势就是物理机具备的特性它都具备。但下边是VirtlO-NIC、VirtlO-Blk,之所以这么做是希望云上的所有镜像、云上的所有系统、虚拟机和物理机之间完全兼容。除了这些功能外,还要一些外部设备,外部设备就是键盘、鼠标、显示器也是通过芯片、通过设备的形势模拟出来。这样就可以实现和虚拟机一样的对外接口,使得运营的操作系统不需要做任何的修改,在虚拟机上拿过来在X-Dragon MOC卡上直接用。下面这部分是卡的中心结构,整个X-Dragon Hypervisor完完全全运行在这张卡上面。它是支持云盘、支持VPC网络、支持存储/网络设备热插拔、支持32块弹性物理网卡同时对X86、ARM、Power等CPU是兼容的。

X-Dragon 自研软件体系

_5


在软件体系里硬件也扮演着重要的作用,所有的软件和硬件做到了整体的深度融合。所谓深度融合就是比如说X-Dragon芯片可能向上需要提供Virtio 网络驱动的接口、Virtio 存储驱动的接口、交互IO层驱动的接口,能让上边的实例具备虚拟机一样的体验。向下要和X-Dragon Hypervisor系统软件融合在一起,云盘要提供更佳极致的性能。

X-Dragon架构支持第三方虚拟化

_6


这是X-Dragon Hypervisor 的一个系统软件,可以从三个部分来讲:
  • 第三方虚拟化:在这样一个产品上其实可以很好的去运行这些虚拟化的软件,要比单纯的在物理机上运行要好很多。不用关心存储的可靠性等问题,因为神龙完全已经解决掉了。也不需要再去做网络的虚拟化,因为提供的32个网卡接口已经完全和阿里云网络虚拟化的基础设施相打通。
  • AnyStack:整个阿里云的Stack是基于飞天的Stack,能够更好的在公有云上和专有云上提供服务。以前OpenStack和ZStack是一种并列的关系,但是在有了神龙技术架构之后无论是OpenStack、ZStack、CloudStack 都能更好的和阿里云的基础设施连在一起。他们可以基于神龙云服务器去搭建自己的Stack,也可以使用阿里云的弹性裸金属服务器进行扩展。
  • 容器:在容器这一块列举了三个容器,这些容器都可以无缝的运行在上边。容器运行在云平台上的时候,传统方法是把容器运行在虚拟机里,但运行在虚拟机里容器的很多体验就会受到限制。我们提供X-Dragon云服务器之后,它不仅能提供像物理机一样的体验,并且它可以支持云盘、支持VPC的网络接口之后,每一个容器可以更好的应用弹性网络的接口通过VPC和整个的云基础设施其他的产品打通。

基于X-Dragon架构的阿里云弹性裸金属产品家族

_7


这是一个基于X-Dragon架构的阿里云弹性裸金属产品的性能表。目前,基于神龙架构的弹性裸金属服务器已正式商业化售卖,支持8核、16核、32核、96核等多个CPU规格,并支持3.7 GHz~4.1 GHz的超高主频实例。

AWS测试款对比

_8


现场同档规格实例的性能测试中,基于神龙架构的阿里云弹性裸金属实例ebmhfg5.2xlarge(8vCPU) 在10000位圆周率计算Superπ中跑出了1分26秒的成绩,比AWS基于Nitro架构计算型实例c5.2xlarge(8vCPU)快了15%。

总结

今天终于能在这里把神龙的技术架构做一个详细的介绍,在未来神龙这样一个技术架构会变成弹性计算核心的硬件发展体系,在这样一个体系里边未来的1.0、2.0、3.0其实能够提供更佳极致的产品级的体验。所以沿着这条道路走下去会不断的推出神龙的技术架构,不仅仅是今天这样的一个弹性物理机,未来还会有很多基于神龙架构的产品。

本文由云栖志愿小组陈欢整理,百见编辑
了解更多裸金属服务器(神龙)的精彩内容请点击:https://promotion.aliyun.com/ntms/act/ebmi.html

相关文章
|
1天前
|
关系型数据库 测试技术 分布式数据库
刷新世界纪录!阿里云PolarDB凭借创新的「三层解耦」架构刷新TPC-C基准测试世界纪录
刷新世界纪录!阿里云PolarDB凭借创新的「三层解耦」架构刷新TPC-C基准测试世界纪录
|
4天前
|
Kubernetes 监控 Serverless
基于阿里云Serverless Kubernetes(ASK)的无服务器架构设计与实践
无服务器架构(Serverless Architecture)在云原生技术中备受关注,开发者只需专注于业务逻辑,无需管理服务器。阿里云Serverless Kubernetes(ASK)是基于Kubernetes的托管服务,提供极致弹性和按需付费能力。本文深入探讨如何使用ASK设计和实现无服务器架构,涵盖事件驱动、自动扩展、无状态设计、监控与日志及成本优化等方面,并通过图片处理服务案例展示具体实践,帮助构建高效可靠的无服务器应用。
|
4天前
|
监控 Kubernetes Cloud Native
基于阿里云容器服务Kubernetes版(ACK)的微服务架构设计与实践
本文介绍了如何基于阿里云容器服务Kubernetes版(ACK)设计和实现微服务架构。首先概述了微服务架构的优势与挑战,如模块化、可扩展性及技术多样性。接着详细描述了ACK的核心功能,包括集群管理、应用管理、网络与安全、监控与日志等。在设计基于ACK的微服务架构时,需考虑服务拆分、通信、发现与负载均衡、配置管理、监控与日志以及CI/CD等方面。通过一个电商应用案例,展示了用户服务、商品服务、订单服务和支付服务的具体部署步骤。最后总结了ACK为微服务架构提供的强大支持,帮助应对各种挑战,构建高效可靠的云原生应用。
|
4天前
|
安全 JavaScript 测试技术
阿里云轻量应用服务器38元1年性能、适用场景简单测评
在阿里云目前的活动中,轻量云服务器2核2G200M峰值带宽每天10点和15点抢购价只要38元一年,e实例云服务器2核2G3M带宽99元1年,u1实例2核4G5M带宽199元一年。其中,阿里云轻量应用服务器38元1年的抢购价,让不少用户心动不已。那么,这款特价轻量应用服务器到底怎么样?是否值得购买呢?本文将从配置、性能、适用场景、价格优势等多个方面对这款轻量应用服务器做个介绍,以供参考。
阿里云轻量应用服务器38元1年性能、适用场景简单测评
|
2天前
|
监控 Cloud Native Java
基于阿里云容器服务(ACK)的微服务架构设计与实践
本文介绍如何利用阿里云容器服务Kubernetes版(ACK)构建高可用、可扩展的微服务架构。通过电商平台案例,展示基于Java(Spring Boot)、Docker、Nacos等技术的开发、容器化、部署流程,涵盖服务注册、API网关、监控日志及性能优化实践,帮助企业实现云原生转型。
|
5天前
|
存储 弹性计算 人工智能
阿里云轻量应用服务器全球上新!
阿里云轻量应用服务器全球上新!
29 0
|
16天前
|
存储 机器学习/深度学习 人工智能
2025年阿里云GPU服务器租用价格、选型策略与应用场景详解
随着AI与高性能计算需求的增长,阿里云提供了多种GPU实例,如NVIDIA V100、A10、T4等,适配不同场景。2025年重点实例中,V100实例GN6v单月3830元起,适合大规模训练;A10实例GN7i单月3213.99元起,适用于混合负载。计费模式有按量付费和包年包月,后者成本更低。针对AI训练、图形渲染及轻量级推理等场景,推荐不同配置以优化成本和性能。阿里云还提供抢占式实例、ESSD云盘等资源优化策略,支持eRDMA网络加速和倚天ARM架构,助力企业在2025年实现智能计算的效率与成本最优平衡。 (该简介为原文内容的高度概括,符合要求的字符限制。)
|
18天前
|
存储 弹性计算 人工智能
2025年阿里云企业云服务器ECS选购与配置全攻略
本文介绍了阿里云服务器的核心配置选择方法论,涵盖算力需求分析、网络与存储设计、地域部署策略三大维度。针对不同业务场景,如初创企业官网和AI模型训练平台,提供了具体配置方案。同时,详细讲解了购买操作指南及长期运维优化建议,帮助用户快速实现业务上云并确保高效运行。访问阿里云官方资源聚合平台可获取更多最新产品动态和技术支持。
|
20天前
|
弹性计算 JavaScript 前端开发
一键安装!阿里云新功能部署Nodejs环境到ECS竟然如此简单!
Node.js 是一种高效的 JavaScript 运行环境,基于 Chrome V8 引擎,支持在服务器端运行 JavaScript 代码。本文介绍如何在阿里云上一键部署 Node.js 环境,无需繁琐配置,轻松上手。前提条件包括 ECS 实例运行中且操作系统为 CentOS、Ubuntu 等。功能特点为一键安装和稳定性好,支持常用 LTS 版本。安装步骤简单:登录阿里云控制台,选择扩展程序管理页面,安装 Node.js 扩展,选择实例和版本,等待创建完成并验证安装成功。通过阿里云的公共扩展,初学者和经验丰富的开发者都能快速进入开发状态,开启高效开发之旅。
|
8天前
|
人工智能 负载均衡 数据可视化
阿里云出手了,DeepSeek服务器拒绝繁忙,免费部署DeepSeek模型671B满血版
阿里云推出免费部署DeepSeek模型671B满血版服务,通过百炼大模型平台,用户无需编码,最快5分钟、最低0元即可完成部署。平台提供100万免费Token,支持DeepSeek-R1和DeepSeek-V3等多款模型调用,有效解决服务器繁忙问题。新手零基础也能轻松上手,享受高效稳定的API调用和自动弹性扩展功能。教程涵盖开通服务、获取API-KEY及配置Chatbox客户端等步骤,详细指引助您快速实现DeepSeek自由。
91 18

热门文章

最新文章