当“超节点”成为算力新秩序,openEuler重构数智基础设施

简介: 随着AI迈向规模化应用,大模型算力需求激增,传统架构难以为继。超节点应运而生,打破“算力孤岛”,实现资源统一调度。openEuler携手产业伙伴,打造全球首个面向超节点的操作系统,推动国产系统从“替代”走向“引领”。2025年,操作系统大会释放强信号:AI与算力深度融合,openEuler 24.03 LTS SP3将于年底上线,2026年或成商业化元年。通过全局资源抽象、异构融合、低时延通信等能力,操作系统正成为智能时代的“神经中枢”。数千企业、数万开发者共建生态,openEuler装机量将破1600万套,加速AI普惠落地,重塑全球算力新格局。

当千行万业全面迈向智能化,AI从试点一步步扩展到生产系统,出现了一个无法回避的现实挑战:

大模型的参数量从千亿级跃升至万亿级,推理时延却要从50ms压缩到15ms。在“越大越快”的悖论下,传统服务器集群的堆卡模式,已无法满足算力的线性增长,对算力、通信和存储的协同提出了前所未有的挑战。

相对应的是“超节点”概念的走红,华为、百度、中科曙光等先后发布了“超节点服务器”:在超大带宽、超低时延、内存统一编址等技术的赋能下,打破了算力协同瓶颈,让计算集群像一台计算机一样高效工作。

物理上的“硬件孤岛”被打破后,还需要一个匹配的“神经中枢”。对下承接硬件、对上承载应用的操作系统,被推向舞台中央。

比如在11月14号的操作系统大会2025上,openEuler协同数十家产业伙伴向外界释放了一个积极信号:共筑面向智能时代的超节点操作系统,让AI能力深度融入系统底层,加速AI的创新落地。

01 面向超节点的操作系统,需要有哪些能力?
在算力基础设施的拼图里,操作系统历来是承上启下的“中枢层”,扮演了底层硬件和上层应用沟通的桥梁。

正如中国工程院院士倪光南在操作系统大会2025的主题演讲中所提到的:“超节点已成为算力基础设施建设和部署的主流形态。智能时代的操作系统将衔接智能时代的硬件和应用,成为释放算力潜能的核心基石。”

由此产生的一个问题是:当超节点成为下一代算力基础设施的主流形态,操作系统需要具备哪些能力?

华为公司董事、ICT BG CEO杨超斌在致辞中列出了来自产业端的“需求清单”:操作系统需要使能超节点硬件,向上层应用提供大带宽、低时延、内存统一编址和池化等核心能力,例如在大模型训练和推理、搜推广等场景中,让计算不再等待通信,从而释放超节点集群的算力潜能。

我们来翻译下这段“行话”。

大模型训练、实时推理、搜推广等极度依赖时延的场景下,通信延迟可能占到任务耗时的60%以上,计算单元已经处理完了“手头的活”,发现下一批数据“还堵在路上”,或者在遥远的另一块内存里。

通过内存统一编址、超大带宽、超低时延等能力,超节点将过去分散在不同物理节点上的资源,“整合”到了一台计算机里。但硬件协同只是“半程”,另一半的落在了操作系统:通信调度要“像内存访问一样快”,资源视图要足够统一,内存池化要做到可控、可见、可信……同样是决定算力是否可用的“枢纽”。

产业端的需求已经明确,操作系统该怎么进化?

开放原子开源欧拉委员会主席熊伟提出了“供给侧”的解题思路,认为面向超节点的操作系统,应该具备三个关键特征:

第一,全局资源抽象、内存统一编址、设备池化管理。不再像管家一样只管自己的“一亩三分地”(单台服务器),而是作为“集群总司令”把所有算力、内存、设备等看作一个统一的资源池。

第二,异构资源融合、大带宽低时延通信,实现平等互联。操作系统需要将GPU、CPU、NPU等不同算力“融合”起来,利用大带宽、低时延的通信能力,将不同计算单元“平等互联”、协同作战。

第三,全局资源视图,以及兼容性接口、原生接口等。对上层的AI框架和大模型开发者来说,操作系统提供的是一个清爽的“全局资源视图”,包括兼容性接口和原生接口,进一步降低适配门槛。

不应该忽略的,还有一个确切的时间表:全球首个面向超节点的操作系统openEuler 24.03 LTS SP3,将于2025年12月30日在社区上线。也就是说,2026年将是“超节点”操作系统的商业化元年。

02 “超节点+大模型”时代,国产操作系统越级
不管是“超节点”架构的出现,还是面向超节点的操作系统创新,都是产业需求驱动的“果”。

就在操作系统大会2025现场,开放原子开源基金会、华为与中国电信天翼云公布了联合发展倡议,将联手促进技术共建、生态共筑和业务共赢,共同构建操作系统在AI和超节点等前沿技术领域的竞争力,推进天翼云和开源欧拉生态繁荣发展。

在openEuler社区,像中国电信这样的产业参与者还有很多,某种程度上已成为一股股产业级力量的汇聚点。

可以佐证的一组数据是:目前openEuler社区已吸引2100多家头部企业、研究机构和高校加入,拥有超过2.3万名开源贡献者,全球下载量突破550万,在全球部署42个镜像节点,为178个国家和地区提供服务。到2025年底,openEuler系操作系统的累计装机量预计将超过1600万套。

嗅觉敏锐的产业参与者,用行动揭示了——“超节点”改变的不单单是计算架构,潜移默化地重构了算力新秩序。

一是企业获取智能算力的方式。

很长一段时间里,企业要想训练大模型,面临的是一种“手工作坊式”的困境——需要花费数月的时间去调试,试图让一堆昂贵的硬件协同工作。而通信墙、内存墙、复杂度墙等像一道道闸门,截断了数据的流动。

两个月前的HC 2025上,华为宣布将开放灵衢2.0技术规范、开放超节点参考架构、开放超节点基础硬件、开源操作系统灵衢组件等等,允许产业界基于技术规范自研相关产品或部件,自主设计基于灵衢的各种产品。

面向超节点的操作系统openEuler 24.03 LTS SP3,则在操作系统层面实现了内存统一编址、资源池化、异构协同等能力,原本只有顶级科技公司才能掌握的复杂系统调优能力,变成了一种“普惠技术”。

企业不需要关心底层插的是A厂的卡还是B厂的卡,不需要担心跨节点的通信延迟,操作系统自动完成了资源的全局抽象和调度。大模型训练与推理的效率提升,智能化的普及周期将被大幅缩短。

二是“国产操作系统”的越级式崛起。

提到国产操作系统,不少人脑海里冒出来的可能是安全、“备胎”等词汇,为了自主可控,往往需要牺牲一部分性能或易用性。

但在操作系统大会2025上, Intel、Arm、 AMD三大芯片企业均成为openEuler社区的捐赠人,数十家操作系统厂商成为开源欧拉社区的首批全球化先锋伙伴,openEuler的全球化进程如火如荼。

原因并不难解释:超节点架构天然需要CPU/GPU/NPU的多架构协同,全球芯片企业和产业客户在openEuler上找到了统一的接口层。背后折射出了一个关键的产业信号,即以openEuler为代表的国产操作系统生态,已经走过追求“替代”的阶段,进入“基础设施创新”的新周期。

在超节点、大模型等前沿领域,openEuler和伙伴们正在无人区探索,去解决产业需要的难题,不仅仅是为了“安全兜底”,正在对高性能计算、资源管理方式、数智底座等进行系统性重构。

就像我们所看到的:在数千家企业、数万开发者的共同推动下,openEuler已经成为“算力新范式的制定者”。

03 写在最后
把视角拉得更长远一些,openEuler完成了一次又一次身份跃迁。

2019年末刚开源时,在外界眼中还是CentOS的一个替代选项;

四年前演进到社区自治,openEuler跻身中国操作系统市场的主流玩家;

到了2024年底,在中国新增服务器操作系统领域,openEuler的市场份额已达50%。

现在,openEuler正向全世界示范——在物理边界被打破、智能无处不在的新世界里,操作系统应该长什么样。甚至可以笃定:未来五年,面向超节点的操作系统将成为智能算力竞争的分水岭。

相关文章
|
13天前
|
人工智能 安全 开发者
解构AI时代的“深圳答案”:以硬实力构建“护城河”
2025年,深圳以“昇腾+光明实验室+华为”协同模式,打造国产AI算力生态。不同于追逐应用热点,深圳聚焦底层突破,构建从芯片到应用的全栈自主链条,通过政企联动、产学研协同,形成“技术攻关—场景验证—迭代优化”闭环,推动算力高效利用与产业深度融合,为全球AI发展提供安全可控的“中国方案”。
91 15
|
2月前
|
人工智能 小程序 5G
读懂5G新通话:可能是AI落地千行万业的首个全民级场景
5G新通话融合AI与DC数据通道,打破传统语音局限,实现“听说看触”多模态交互。用户拨打热线即可在通话中挂号、咨询、共享屏幕,服务直达指尖。从客服到医疗、助老、外贸,通话正变为集沟通、操作、服务于一体的“生活入口”。2025年,超70款终端支持,6000万用户已体验。通话即服务,时代已变。
305 10
|
20天前
|
机器学习/深度学习 编解码 JSON
混元OCR模型宣布开源,参数仅1B,多项核心能力SOTA
腾讯混元推出全新开源OCR模型HunyuanOCR,仅1B参数,基于原生多模态架构,实现端到端高效推理。在复杂文档解析、文字检测识别等多场景表现卓越,支持14种小语种翻译,广泛适用于票据抽取、视频字幕识别等应用,多项指标达业界SOTA水平。
316 8
|
20天前
|
缓存 运维 监控
一次内存诊断,让资源利用率提升 40%:揭秘隐式内存治理
阿里云云监控 2.0 推出 SysOM 底层操作系统诊断能力,基于 eBPF + BTF 协同分析,无需侵入业务,即可一键完成从物理页到文件路径、再到容器进程的全栈内存归因,让“黑盒内存”无所遁形。
465 74
|
20天前
|
人工智能 安全 搜索推荐
杭州AI开源生态大会·魔搭社区开发者嘉年华全回顾
11月22日,杭州AI开源生态大会暨“魔搭社区”开发者中心启用仪式在云谷中心举行。大会汇聚超3000名开发者,发布“两张清单”与AI开源政策包,启用首个线下开发者空间,推动开放、共建、共创的AI生态发展。
259 10
|
19天前
|
存储 弹性计算 安全
阿里云最便宜的云服务器,38元、99元、199元云服务器配置、优势及组合优惠详解
阿里云目前有多款价格非常实惠的云服务器产品,其中轻量应用服务器仅需38元/年,经济型e实例云服务器99元/年,通用算力型u1实例云服务器199元/年,让云服务器购买变得更加亲民。本文将详细介绍这些云服务器的配置、套餐优势、购买规则、注意事项以及组合优惠等内容,帮助大家更详细的了解这几款特惠云服务器,并选择适合自己的云服务器产品。
388 18
|
20天前
|
存储 算法 安全
员工网络行为管理中的哈希表:高效数据处理C++算法
本文探讨哈希表在员工网络行为管理中的应用,通过C++实现高效数据存储与查询。结合除留余数法与异或运算的哈希函数、链地址法解决冲突,并支持动态扩容,确保高并发下快速响应访问记录查询与禁用站点检测,提升企业信息安全与管理效率。(238字)
71 12
|
15天前
|
存储 缓存 数据挖掘
阿里云服务器租用价格,特价38元、99元、199元云服务器与最新活动价格参考
截止目前阿里云服务器价格最便宜主要有三款,轻量应用服务器2核2G峰值200M带宽38元1年;云服务器经济型e实例2核2G3M带宽99元1年;云服务器通用算力型u1实例2核4G5M带宽199元1年。除此之外,还有4核16G10M带宽只要89元/1个月、210元/3个月,8核32G10M带宽只要160元/1个月、480元/3个月。本文为大家分享目前阿里云的各个特价云服务器及活动价格情况,以供参考和选择。
244 17
|
20天前
|
人工智能 前端开发 JavaScript
新的LLM交互模式!大模型终于能自己生成交互式 UI 了
Google Research推出的Generative UI,让大模型不仅能生成内容,还能一键创建含地图、图表、小游戏等交互功能的完整网页。告别“文字墙”,迈向“内容即应用”的新时代,82.8%用户偏爱此创新体验。
309 8
|
20天前
|
数据采集 弹性计算 运维
云服务诊断:一键定位异常,快速恢复业务
云服务诊断是阿里云推出的免费运维工具,提供“资源健康状态”和“问题诊断”两大功能。可精准监控每个实例的健康状况,支持一键全量诊断与常见问题场景快速排查,帮助用户迅速定位并修复ECS、SLB、EIP等资源异常,提升运维效率,保障业务稳定运行。
309 21