CXL 接口库开源!龙蜥智算联盟 MeetUp 圆满举办,聚焦 AI Infra全栈创新落地

简介: 围绕 AI Infra 全栈技术趋势与创新实践,与现场开发者进行了深入的技术交流,共同勾勒下一代 AI Infra 的技术蓝图。

近日,以“智算时代的基础设施创新”为主题的龙蜥智算联盟 MeetUp 在北京海淀成功举办。本次活动由龙蜥社区、龙蜥智算联盟联合主办,得到了 InfoQ、CSDN、思否、51CTO、阅码场、OSCHINA、极星会等业内知名媒体与社区的大力支持并同步线上直播。现场来自阿里云、浪潮信息、中国科学技术大学、上海交通大学、郑州大学、沐曦股份、Imagination、联智科技、中兴通讯等产学研领域的技术专家带来了精彩的技术分享,围绕 AI Infra 全栈技术趋势与创新实践,与现场开发者进行了深入的技术交流,共同勾勒下一代 AI Infra 的技术蓝图。

(图/活动现场嘉宾合影)

会议伊始,浪潮信息系统软件研发部总经理、龙蜥社区技术委员会副主席苏志远先生为本次活动致开场辞。苏志远从芯片驱动、操作系统、算子库、AI 软件栈等系统软件研发创新到龙蜥社区的技术治理,为与会者描绘了智算技术创新与智算基础设施生态建设的清晰路径。

随后,阿里云资深技术专家、龙蜥智算联盟主席宋卓先生上台致辞。宋卓从联盟视角切入,结合龙蜥智算联盟的规划,就如何抓住 AI 南北向深度协同与创新的机遇提出见解,为接下来的技术分享拉开序幕。

 

致辞环节结束后,技术分享正式拉开帷幕。龙蜥社区 SGLang 项目开发者苏峰先生带来了《从黑盒到透明:SGLang tracing 如何赋能 LLM 推理性能诊断》的技术分享。他针对大模型推理服务中“请求延迟到底卡在队列等待、Prefill 计算还是 Decode 阶段”这一黑盒难题,介绍了基于 OpenTelemetry 标准的端到端全链路追踪系统,让性能调优从"猜测驱动"转变为"数据驱动"。

(图/苏峰)

中国科学技术大学计算机科学与技术学院特任副研究员白有辉老师进行了《面向multi-agent 场景的长上下文管理方法》的主题演讲。白老师介绍了如何利用稀疏化注意力机制结合层次化内存管理,突破 AI 芯片物理内存墙限制,提升推理效率。

(图/白有辉)


新加坡国立大学与上海交通大学联培博士后、2025 年度 CCF 博士学位论文激励计划获得者崔炜皞先生分享了《MuxWise:面向高 Goodput LLM 服务的 GPU 内 Prefill-Decode 复用技术》。他介绍了如何在一个 GPU 内实现 Prefill 与 Decode 的空分复用,实现高达 3 倍的 Goodput 提升,其团队已将相关代码合并入 SGLang 主分支,为社区做出了开源贡献。

(图/崔炜皞)

浪潮信息系统软件架构师 Hong Lion 先生带来了《CXL 池化内存在 AI 推理场景中的应用探索》的前沿技术分享,从理论探索到工程落地,展示了 CXL 技术在智算中心真实业务场景中的应用前景。


分享结束后,活动现场还举行了CXL 接口库开源发布仪式——浪潮信息正式将 CXL 接口库开源至龙蜥社区,为开发者在 CXL 内存池化、异构计算资源调度等方面提供标准化的接口支持。浪潮信息系统软件研发部高级研发经理张百林先生与龙蜥智算联盟主席宋卓先生共同启动了发布仪式。

茶歇过后,沐曦股份AI 研究院院长、清华大学集成电路学院博士李兆石先生带来了《InferMazeMap:分布式推理建模框架》的技术分享。他介绍了如何将模型结构、GPU 规格、并行配置、通信拓扑与优化策略统一映射为 TTFT、TPOT、TGS 等关键性能指标,为算子开发者、GPU 架构师与推理框架开发者提供一站式设计与建模分析工具

(图/李兆石)

Imagination Technologies 颖脉信息高级工程师赵茜女士分享了《助力边缘 AI 的高效 GPU 创新架构》。她展示了新一代 GPU 在端侧 AI 领域的创新设计思路,探讨了如何在 NPU 性能密度与 CPU 可编程性之间取得平衡,推动 AI 从云端走向设备端。

(图/赵茜)

联智科技CEO、北京软件和信息服务业协会特聘专家付鸿雁女士进行了《从割裂到协同——超智融合算力中心的系统化搭建思路与落地路径》的主题演讲。她深耕高性能计算二十余年,指出超智融合不是简单的硬件堆砌,而是从芯片到运维的全栈深度融合,为算力中心的系统化搭建提供了落地路径。

(图/付鸿雁)

中兴通讯 AI Infra 资深算法工程师王辰宇先生带来了《量化部署+算子优化:解锁国产化硬件大模型高效推理破局之道》的实战分享。他介绍了如何通过低比特量化实现高效部署,以及如何通过多算子融合与单算子调优,全面提升端到端推理性能。

(图/王辰宇)

郑州大学电气与信息工程学院教授、中国计算机学会多媒体专业委员会执行委员陈恩庆先生作为最后一位演讲嘉宾,带来了《面向具身智能开放环境的云边协同视觉检测识别》的分享。他介绍了如何利用云端大模型与本地算力的云边协同,提升具身智能体在非结构化开放场景中的零样本识别与增量学习能力。

(图/陈恩庆)

从 SGLang 全链路追踪,到 MuxWise 的 GPU 内 PD 复用;从 CXL 池化内存的开源发布,到 InferMazeMap 的分布式推理建模;从边缘 AI 的 GPU 创新架构,到超智融合算力中心的系统化搭建;再到国产化硬件的量化部署与具身智能的云边协同——本次活动共同见证了一场覆盖 AI Infra 全栈的技术巡礼。


最后,感谢本次活动各位嘉宾的精彩演讲,也感谢浪潮信息及龙蜥社区伙伴:潘珏君、张旭芳、周美青、蔡佳丽、金美琴、倪俊雄(以上排名不分先后)等人的组织与配合,使得本次 MeetUp 活动圆满结束


视频&课件

本次 MeetUp 回顾视频及 PPT 已上传至龙蜥官网,欢迎点击查看:

PPT课件:https://docs.openanolis.cn/document/detail/rpzigrnb

视频回放:https://openanolis.cn/video#1613533175946559578

附活动现场集锦:

—— 完 ——


相关文章
|
8天前
|
缓存 安全 小程序
Lua-LSM 系列二:从 CopyFail 到 Dirty Frag,看 732 字节的漏洞,用 79 字节关上
最近发生的真实安全漏洞场景,展示 Lua-LSM 如何在 79 字节内完成对内核提权漏洞的热缓解。
|
8天前
|
缓存 安全 网络协议
Anolis OS 不受 Fragnesia(CVE-2026-46300) 漏洞影响
经龙蜥社区安全团队评估,Anolis OS 各版本均不受 CVE-2026-46300 影响。
|
8天前
|
人工智能 自然语言处理 算法
少儿AI英语背单词APP的开发
这是一款专为3-12岁儿童设计的AI英语背单词APP,深度融合AI生成、自适应算法与多感官游戏化交互。涵盖动态情境记忆、语音互动、游戏巩固、智能复习及家长报告五大模块,尊重少儿认知规律,让学单词更自然、有趣、有效。(239字)
|
8天前
|
人工智能 弹性计算 安全
2026年阿里云入门级云服务器特惠价格:2核2G38元1年、99元1年,2核4G9.9元1个月、199元1年
阿里云2026年推出四款特惠云服务器,覆盖从个人到企业的多元需求。轻量应用服务器2核2G抢购价仅38元/年,内置WordPress、OpenClaw等镜像,开箱即用,适合个人开发者与学生;2核4G版本9.9元/月起,可一键部署AI助理。经济型e实例99元/年、通用算力型u1实例199元/年,均享"新购续费同价"政策,有效解决后续涨价顾虑。其中e实例不限新老用户,u1实例面向企业用户,活动持续至2027年3月31日。此外还有u2a实例2.5折、九代实例6.4折及百炼Token Plan、JVS Claw等AI产品优惠。
|
8天前
|
安全 小程序 Linux
开源!在 Linux 内核里跑 Lua-LSM 小程序,是什么样的体验?
不需要任何编译工具链,不需要安装额外软件。
|
8天前
|
人工智能 JSON 运维
2026 生产级 AI Agent 自动化:零重型框架,彻底解决多步任务不稳定难题
本文提出“文件即状态”轻量架构,用5个文件实现AI Agent多步任务的稳定执行,无需LangGraph等重型框架。支持断点续跑、幂等重试、跨Agent协同,个人开发者7天即可落地生产级自动化。(239字)
|
16天前
|
缓存 人工智能 运维
SysOM Agent智能运维系列:Pod内存高告警,一次对话30秒定位根因
让内存诊断从"靠经验排查"变成"可解释、可复现、可执行"的工程化流程。
|
16天前
|
人工智能 运维 编译器
|
16天前
|
安全 Cloud Native 数据中心
|
16天前
|
人工智能 自然语言处理 安全
龙蜥社区4月技术委员会召开:同步社区质量基准建设及下一代操作系统规划
会上围绕 Anolis OS 23.5 版本规划、龙蜥社区质量基准建设、下一代操作系统规划方向、Agentic OS 架构设计、内核安全机制创新等技术议题进行了分享与探讨。

热门文章

最新文章