架构师之路 - 服务器硬件扫盲

简介: 架构师之路 - 服务器硬件扫盲

很多架构师都是从软件开发成长起来的,大家在软件领域都有很深的造诣,大部分人对硬件接触的很少。而成为架构师后需要频繁的跟人 、硬件 、软件 、网络打交道,本篇文章就给大家带来服务器硬件方面的相关知识,主要包括服务器、CPU、内存、磁盘、网卡。


服务器


根据服务器的外形和使用场景我们将服务器分为以下四种:

  • 塔式服务器
  • 塔式服务器类似于台式机,主要适用于没有机房机架的公司,一般存放于中小办公环境。
  • 机架式服务器
  • 机架式服务器需要放置在标准机柜中,多存放于数据中心。
  • 刀片服务器
  • 刀片服务器为了提供更高的密度,它比机架式服务器更节省空间,同时,散热问题也更突出,往往要在机箱内装上大型强力风扇来散热,一般应用于大型的数据中心或者需要大规模计算的领域。
  • 高密度服务器
  • 高密度服务器是为了实现更高的空间利用率。

主板架构

服务器的机箱只是外壳,核心架构还是主板。

主板架构

这个图是Intel典型的主板芯片组架构:服务器的主板有个统一的中央芯片组(Intel C600),芯片组可以连接多个CPU(E5-2400/2600),CPU之间通过QPI快速通道进行连接,CPU与内存插槽,PCIE插槽之间连接,芯片组还与低速的外设进行连接(USB、网卡、SATA等)。


服务器选型考虑因素

做服务选型主要基于以下几个方面:

  • 限制条件:操作系统OS、客户喜好及预算、应用系统的编程语言
  • 部署规模:如果规模较大,需要考虑空间占用问题,可考虑刀片或高密度服务器
  • 扩展性:内存数量、磁盘数量、PCI插槽数量
  • 稳定性
  • OS:UNIX > Linux > Windows
  • 硬件:小型机 > x86服务器
  • 物理机、虚拟机、容器
  • 计算特点的考虑:是要将一个大的计算能力进行分割,灵活分配,还是有一个很大的课题要用多台机器联合计算
  • IO特点的考虑:吞吐率与IOPS多大?虚拟机能否承受?

服务器厂商

  • 国内的服务器厂商主要有:曙光、华为、浪潮、H3C、联想、长城等
  • 国外的服务器厂商主要有:Dell、HP、IBM

CPU


CPU作为服务器的核心固件,我们主要通过以下几个概念来了解:

  • Socket Socket俗称多少路,就是一个服务器主板上可以安装几个物理CPU
  • Core 一个物理CPU实际可以有几个内核(Core),比如我们经常听到的32核64核、128核等等
  • 超线程 如果一个内核可以同时运行2个线程我们就称这个CPU具有超线程能力,反之则不具备超线程能力
  • 频率 也叫主频,这个越高越好
  • 内存通道 每个CPU能支撑的最大内存数,Intel最新的能支持6个
  • 内存带宽、内存规格 CPU支持什么规格的内存,支持的频率范围是多少

以上的这些概念数据可以通过CPU的产品规格书中进行详细了解。在服务器上可以通过 lscpu 命令查看cpu信息

cpu详情

上图服务器CPU显示有72个,是因为有2个Socket,每个Socket有18核而每核可以同时运行2个线程,通过 2 x 18 x 2 = 72 得到

厂商

  • 国外的CPU厂商主要有:Intel、AMD
  • 国内的CPU厂商主要有:龙芯、兆芯、飞腾、海光、申威、华为等

主流产品介绍

Intel系列

Intel现在主推的是“Intel至强可扩展”系列,在这个系列下又分为四档:铂金、金、银、铜,每档下面又有不同的型号

intel系列对比

AMD系列

AMD系列主要用到的是霄龙系列,霄龙系列CPU核数很高,下面我们看看几款具体的产品

型号 CPU核心数 线程数量 最大加速时钟频率 基准时钟频率 默认TDP/TDP
霄龙7742 64 128 高达3.4GHZ 2.25GHZ 225W
霄龙7702 64 128 高达3.35GHZ 2GHZ 200W
霄龙7702P 64 128 高达3.4GHZ 2GHZ 200W
霄龙7642 48 96 高达3.35GHZ 2.3GHZ 225W
霄龙7552 48 96 高达3.3GHZ 2.2GHZ 200W
霄龙7542 32 64 高达3.4GHZ 2.9GHZ 225W

华为鲲鹏系列

「鲲鹏916(低功耗级)」

  • 32核/2.4GHz/16nm/75W
  • 4通道DDR4控制器
  • PCIe 3.0 ,10GE
  • 支持2路互联

「鲲鹏920-3326/4826(极致效能型)」

  • 32/48核/2.6GHz/7nm/120/150W
  • 8通道DDR4控制器
  • PCIe 4.0 ,100GE,CCIX
  • 支持2/4路互联

「鲲鹏920-3326/4826(极致性能级)」

  • 64核/2.6GHz/7nm/180W
  • 8通道DDR4控制器
  • PCIe 4.0 ,100GE,CCIX
  • 支持2/4路互联

主流CPU型号性能横向对比

cpu性能对比

通过上图大家可以看到国产CPU与国外CPU之间的差距,性能基本只有Intel中档CPU性能的一半左右,国产CPU还有很长的路要走。


NUMA

NUMA 即 Non-Uiform Memory Access(非一致性内存访问),结合我们之前讲述的主板架构,两颗CPU之间有一个通道,每个CPU与各自的内存通道进行直连,可以通过下图直观看出。

numa

CPU0 访问 左边的内存通道速度很快,CPU1访问右边的内存通道也很快,当CPU1要访问左边的内存通道必须要借助CPU0的帮忙,需要先通过QPI总线找到CPU0,再来访问左边的内存通道,这就产生了额外的开销,访问左边内存通道的开销相当于直连访问右边通道开销的3倍。

「所以对于计算密集型任务我们需要尽量避免这种跨CPU的内存访问,这就是NUMA的问题,非一致性指的是访问本地和跨CPU访问的代价差别不一致」

我们可以通过指令 numactl -s 查看numa的信息

可以使用指令 numactl --cpunodebind=0 --membind=0 command 指定进程使用的numa节点和内存

如上就是让 command 指令只使用cpu0 ,和内存0,这就使得进程指令在运行的时候使用的CPU和内存在同一侧,达到计算性能速度最大化的效果。


内存


内存大家平时工作中接触的都比较多,对于内存我们主要通过以下几个方面来了解:

  • 内存规格
    DDR3、DDR4,目前主流已经是DDR4
  • 内存大小
    2G、4G、8G、16G、32G
  • 内存频率
    1333MHz, 1600MHz, 1866MHz、2133MHz, 2400MHz , 2666MHz
  • 带宽
    即CPU对内存实际读写数据的速度,DDR4 2400内存的带宽为30GB/s左右
  • 通道
    一个CPU可以连接多个内存,CPU上的内存通道数指的是CPU能并发访问直连多少个内存。4通道表示CPU可以同时访问与之直连的4根内存,这样就能达到带宽翻四倍的效果。
    在4通道模式下读取1G的数据进内存,最终数据会分布在4根内存上而不是一根内存,这就实现了速度的翻4倍;
    每颗CPU对自己的内存控制器直连的内存访问速度较快,要访问另一颗CPU连接的内存时,需要通过QPI总线,开销为本地内存的3倍。

了解内存信息

主要通过以下三个命令全面了解内存信息

  • 我们可以通过 dmidecode -t memory | more 指令查看内存信息,效果如下:

内存信息

  • 可以使用 dmidecode -t memory | grep Size 指令查看内存大小并判断内存是否正常工作

查看内存插槽

将内存插入主板时一般需要对称插入,通过上图我们可以看到下面有根内存不工作。

  • 可以通过 free 指令查看内存容量

内存容量

系统剩余内存 available 是我们最关心的一个值,不要被free列唬住了。


磁盘


对于磁盘我们主要通过吞吐率和IOPS两个指标来对其衡量

「吞吐率/吞吐量」:单位时间内读写的数据量

  • 机械硬盘:约100MB/s – 200MB/s;
  • 普通固态硬盘:200MB/s - 500MB/s;
  • PCIE固态硬盘(直连CPU):900MB/s - 3GB/s

「IOPS」:每秒IO操作的次数

  • 机械硬盘:100-200
  • 普通固态硬盘:30000-50000
  • PCIE固态硬盘(直连CPU):数十万

为什么很多性能比较慢的服务在软件层面进行优化收益很小,而更换一块固态硬盘就能解决所有问题,问题就在这里。

普通固态硬盘的吞吐率大概为机械硬盘的2~3倍,而IOPS却达到了机械硬盘的250~300倍。

「IOPS和数据吞吐量适用于不同的场合:」

在随机读写频繁的应用中,如OLTP(Online Transaction Processing),IOPS是关键衡量指标。

对于大量顺序读写的应用,则更关注吞吐量指标。

e.g:

读取10000个1KB文件,用时10秒  Throught(吞吐量)=1MB/s ,IOPS=1000  追求IOPS


读取1个10MB文件,用时0.2秒  Throught(吞吐量)=50MB/s, IOPS=5 追求吞吐量


网卡


网卡,又称网络适配器或网络接口卡,英文名为Network Interface Card。在网络中,如果有一台计算机没有网卡,那么这台计算机将不能和其他计算机通信,它将得不到服务器所提供的任何服务了。当然如果没有网卡,就称不上服务器了,所以说网卡是服务器必备的设备,就像普通PC(个人电脑)要配处理器一样。

我们也可以也通过以下几个维度来了解下网卡:

「网卡速度规格」
100M、1G、10G、25G

「网卡接口类型」
RJ45(电、短距离)、光纤(光、长距离)

「网卡绑定模式」

多网卡绑定一方面能够提高网络吞吐量,另一方面也可以增强网络高可用。从软件的角度来看,多网卡绑定实际上只需要提供一个额外的bond驱动程序即可,通过该虚拟网卡驱动程序可以将实际多块网卡屏蔽,对TCP/IP协议层而言只存在一个Bond网卡。

Linux主要有以下几种绑定模式:

  • broadcast (广播策略:data is transmitted over all ports)
    这种模式的特点是一个报文会复制两份往bond下的两个接口分别发送出去。当有对端交换机失效,我们感觉不到任何丢包。
  • round-robin (轮询策略:data is transmitted over all ports in turn)
    该模式下,链路处于负载均衡状态,数据以轮询方式向每条链路发送报文,基于per packet方式发送。即每条链路各一个数据包,这模式好处在于增加了带宽,同时支持容错能力,当有链路出问题,会把流量切换到正常的链路上。
  • active-backup (主备策略:one port or link is used while others are kept as a backup)
    在该模式下,一个端口处于主状态,一个处于备状态,所有流量都在主链路上发出和接收,备链路不会有任何流量。当主端口down掉时,备端口接管主状态。
  • loadbalance (适配器传输负载均衡:with active Tx load balancing and BPF-based Tx portselectors)
    在该模式下,通过源和目标mac做hash因子来做xor算法来选择链路,这样就使得到达特定对端的流量总是从同一个接口上发出。
  • lacp (动态链路聚合:implements the 802.3ad Link Aggregation Control Protocol)
    在该模式下,操作系统和交换机都会创建一个聚合组,在同一聚合组下的网口共享同样的速率和双工设定。

小结


本文给大家介绍了服务器硬件的基础知识,只有对硬件有了全面的认识和了解我们才能在硬件选型时做到心中有沟壑,可以针对各个组件的特点选取合适的硬件来支撑其运行。



如果本文对你有帮助,别忘记给我个三连:点赞,转发,评论咱们下期见!

收藏 等于白嫖点赞 才是真情!

目录
相关文章
|
3天前
|
机器学习/深度学习 弹性计算 人工智能
阿里云服务器ECS架构区别及选择参考:X86计算、ARM计算等架构介绍
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下这些架构各自的主要性能及适用场景,以便大家了解不同类型的架构有何不同,主要特点及适用场景有哪些。
|
8天前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
2月前
|
机器学习/深度学习 弹性计算 人工智能
阿里云服务器架构有啥区别?X86计算、Arm、GPU异构、裸金属和高性能计算对比
阿里云ECS涵盖x86、ARM、GPU/FPGA/ASIC、弹性裸金属及高性能计算等多种架构。x86架构采用Intel/AMD处理器,适用于广泛企业级应用;ARM架构低功耗,适合容器与微服务;GPU/FPGA/ASIC专为AI、图形处理设计;弹性裸金属提供物理机性能;高性能计算则针对大规模并行计算优化。
|
2月前
|
存储 缓存 弹性计算
Codota的服务器存储架构
Codota的服务器存储架构
33 5
|
3月前
|
监控 网络协议 安全
DNS服务器故障不容小觑,从应急视角谈DNS架构
DNS服务器故障不容小觑,从应急视角谈DNS架构
81 4
|
3月前
|
机器学习/深度学习 监控 Serverless
无服务器架构(Serverless)
无服务器架构(Serverless)
108 4
|
1月前
|
弹性计算 API 持续交付
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
|
2月前
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
54 3
|
2月前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####
|
1月前
|
Java 开发者 微服务
从单体到微服务:如何借助 Spring Cloud 实现架构转型
**Spring Cloud** 是一套基于 Spring 框架的**微服务架构解决方案**,它提供了一系列的工具和组件,帮助开发者快速构建分布式系统,尤其是微服务架构。
178 69
从单体到微服务:如何借助 Spring Cloud 实现架构转型