高性能网络SIG月度动态:龙蜥5.10内核将首次提供SMC-D本地通信试验性支持

简介: 龙蜥5.10内核将首次提供SMC-D本地通信试验性支持等。

高性能网络 SIG(Special Interest Group)在云计算时代,软硬件高速发展,云原生、微服务等新的应用形态兴起,让更多的数据在进程之间流动,而网络则成为了这些数据流的载体,在整个云时代扮演着前所未有的重要角色。在这个万物互联的时代,云上的网络通信效率对各种服务至关重要,高性能网络兴趣组致力于利用 XDP、RDMA、VIRTIO 等新高效通信技术,结合软硬件一体化的思想,打造高性能网络协议栈,提升云计算时代数据中心应用的网络的性能。

01 SIG 整体进展

本月高性能网络 SIG 的主要工作聚焦在 ANCK 内核网络、SMC 和 virtio 上。

本月关键进展:

1. SIG 本月与 IBM SMC 小组通过多次会议与邮件确定了 SMC-D 虚拟 ISM 设备支持所需的全部协议修改。此特性将作为 supplemental feature 进入 SMCv2.1 协议中。该特性将从 ANCK-016 开始提供 Experimental 的支持。

2. SIG 本月发起了新的 virtio-net: support the RSS context 提案,用以支持 virtio 队列流量隔离需求;以及 virtio-net: support distinguishing between partial and full checksum 提案,用于实现在加载 XDP 的同时保持设备的 checksum 卸载能力。目前处在上游讨论与 review 中。

02 ANCK 内核网络

安全

本月网络方向共计修复 9 个 CVE,覆盖 sctp/sched/netfilter/tls/mpls 等模块,CVE 列表:

CVE-2023-1074,CVE-2022-47929,CVE-2023-32233,CVE-2023-1075,CVE-2023-26545,CVE-2023-28466,CVE-2023-1380,CVE-2023-4563,CVE-2023-40283,CVE-2023-4128。

03 SMC

本月 SIG 在 SMC 上工作主要聚焦于 SMC-D 虚拟设备协议拓展和 loopback-ism 的上游代码实现。

SMC-D v2.1 协议拓展与 loopback-ism 代码实现

本月 SIG 与 IBM SMC 小组的多次会议及邮件中最终确认了 SMC-D 虚拟设备所需的协议修改。SMC-D 虚拟设备的引入使 SMC-D 不再局限于 IBM z 平台,成为普惠的同物理设备内 TCP 加速方案。SMC-D 协议在现有 SMCv2.1 基础上增加对虚拟设备的 extended GID 支持、预留 CHID、以及 CLC 握手适配,作为 supplemental feature 进入 SMCv2.1 中。相应的,作为 SMC-D 虚拟设备之一的 loopback-ism 代码实现也发送至上游。loopback-ism 是一种模拟 IBM z 平台 ISM 设备的纯软件实现设备,与 SMC-D 协议配合以加速同 OS 内进程间或容器间通信。目前已 review 到 v4 版本。

04 virtio

本月 SIG 在 virtio 上工作主要聚焦在 RSS context 提案、virtio XDP 支持与设备校验和能力共存、以及多个缺陷修复。

virtio RSS context

高性能网络小组为了支持 virtio 队列流量隔离的需求,和 Nvidia 共同发起了 RSS context 的提案。本月推进的 v3 版本,目前已经获得了另一个投票成员 Marvell 的 Satananda 的 Acked-by。

virtio XDP 支持与设备校验和能力共存

目前 virtio 同主机的 VM 之间支持接收具有部分校验和的报文,以节省设备的计算开销。由于 XDP 会重写报文的一些信息,导致具有部分校验和的报文被丢弃,因此,加载 XDP 程序必须清除设备的校验和卸载能力,然后这样会导致失去了硬件卸载 checksum 的能力。

为了实现在加载 XDP 程序的同时保持设备的 checksum 卸载的能力,高性能网络小组曾经尝试过在 XDP 处理后重新探测校验和的方法,但是该方法面临了众多挑战,例如 XDP 用户程序为报文增加了外层隧道,会造成无法探测和探测失败的问题;再例如程序执行 XDP_TX action 时,设备由于缺少部分校验和卸载需要的信息而造成丢包。因此,高性能网络小组从该问题的源头出发,重新设计了一个简单明了的解决方案,发起 virtio-net: support distinguishing between partial and full checksum 的提案,帮助虚拟机大大节省验证校验和造成的 cpu 开销,目前该提案正在与社区讨论中。

中断聚合

高性能网络小组为了在 virtio 上支持 netdim,发现并修复了多个相关的缺陷。

相关链接:

高性能网络 SIG 主页:https://openanolis.cn/sig/high-perf-network

注:更多龙蜥 SIG 月度动态可点击这里查看。

—— 完 ——

加入龙蜥社群

加入微信群:添加社区助理-龙蜥社区小龙(微信:openanolis_assis),备注【龙蜥】与你同在;加入钉钉群:扫描下方钉钉群二维码。

关于龙蜥

龙蜥社区是立足云计算打造面向国际的 Linux  服务器操作系统开源根社区及创新平台。龙蜥操作系统(Anolis OS)是龙蜥社区推出的 Linux 发行版,拥有三大核心能力:提效降本、更加稳定、更加安全。

目前,Anolis OS 23 已发布,全面支持智能计算,兼容主流 AI 框架,支持一键安装 nvidia GPU 驱动、CUDA 库等,完善适配 Intel、兆芯、鲲鹏、龙芯等芯片,并提供全栈国密支持。

加入我们,一起打造面向云时代的操作系统!

相关文章
|
IDE Linux 开发工具
从旧服务器迁移svn到另一台新服务器中(linux系统)|遇到诸多坑,已解决
从旧服务器迁移svn到另一台新服务器中(linux系统)|遇到诸多坑,已解决
|
9月前
|
数据挖掘 Windows
【服务器数据恢复】服务器迁移数据时数据丢失的数据恢复案例
一台安装Windows操作系统的服务器。工作人员在迁移该服务器中数据时突然无法读取数据,服务器管理界面出现报错。经过检查发现服务器中一个lun的数据丢失。
|
7月前
|
弹性计算 Linux 网络安全
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
现在越来越多的个人和企业用户选择将其他云平台或者服务商的业务迁移到阿里云,但是如何快速且安全完成迁移是很多用户比较关注的问题,我们可以选择使用阿里云提供的服务器迁移中心(Server Migration Center,简称SMC),这个产品是阿里云提供给您的迁移平台,专注于提供能力普惠、体验一致、效率至上的迁移服务,满足您在阿里云的迁移需求。本文为大家展示使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云的教程,以供参考。
使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考
|
存储 弹性计算 Linux
弹性计算Clouder认证:服务器迁移上云——课时4:什么是服务器迁移中心?
弹性计算Clouder认证:服务器迁移上云——课时4:什么是服务器迁移中心?