沐“蜥”芯生,开源共创 | SGLang MeetUp 圆满结束,共同探索 AI 推理落地新路径

简介: 技术PPT已上传,欢迎下载查看。

6 月 6 日,由沐曦股份联合龙蜥社区、SGLang 社区等举办的“沐‘蜥’芯生,开源共创——SGLang 技术交流 Meetup在北京圆满举办,线上观看人次 65 万+。本次 Meetup 邀请了沐曦股份、阿里云、SGLang 社区、龙蜥社区等企业和社区的多位嘉宾,与现场 100 多位技术专家和高校学生,围绕 SGLang 开源生态演进、大模型推理性能优化与工程落地、异构算力适配等核心议题,展开了深入探讨与思维碰撞。

五大主题演讲:聚焦 SGLang 生态,覆盖推理全技术链路

今年以来,OpenClaw“龙虾”Agent智能体风靡全球,PD 分离、长上下文的 KV Cache 显存利用、多智能体推理成为了 AI 行业热议话题。本次 Meetup 活动共设置五场主题演讲与一场圆桌对话,从底层可观测性到上层多智能体推理架构,从社区前沿演进到落地工程实践,完整勾勒了 SGLang 推理生态的技术版图。


SGLang Core Maintainer(SGLang 社区核心维护者)童心源率先登台,带来了《SGLang Roadmap:面向大模型与多模态模型的高性能开源推理系统》主题演讲。童心源系统介绍了SGLang 开源推理框架的发展历史,并重点讲解了 SGLang 在 PD 分离、多模态模型与硬件支持、以 RL/post-training(强化学习/后训练)部署等关键技术场景的创新突破,以及其在开源社区协作的进展与最新性能优化路线图。

(图/童心源)


龙蜥社区 SGLang 项目开发者苏峰和龙蜥社区智算联盟委员常怀鑫则分享了题为《从全链路可观测到智能分析:AI 性能分析范式的演进与实践》的演讲。两位嘉宾在演讲中回顾了 SGLang Tracing 的可观测性建设历程,并结合具体案例探讨如何利用 AI Agent 实现 SGLang 框架的性能优化。

活动下半场,阿里云高级技术专家马腾上台发表了《记忆感知驱动:基于 Mooncake 的多智能体推理架构优化》主题演讲。马腾深入剖析了 Mooncake 如何以 KV Cache 显存为“物理工作记忆”载体,并通过 PD 分离架构与全局共享 KV Cache 显存池,实现多智能体场景“一次计算、全局共享”的记忆复用。

(图/马腾


腾讯云高级工程师陈凯悦分享了《从社区到生产:基于 SGLang HiCache + Mooncake 的深度优化与企业级落地工程实践》,还原了如何将 HiCache 与 Mooncake 规模化部署到内部推理集群、以及落地企业客户环境中的具体实践。

(图/陈凯悦)


沐曦股份 SGLang 推理引擎核心开发者杨鑫压轴登场,带来《沐曦 GPU 对 SGLang 的深度适配与工程实践》主题演讲,详细介绍了 SGLang 在沐曦 GPU 上的适配流程、沐曦自研 MXMACA 软件栈、最新模型适配情况与性能优化实践。

(图/杨鑫)


针对硬核主题分享,现场观众踊跃提问,结合实际开发部署中遇到的具体问题,与嘉宾现场积极探讨各种可能的解决方案。


圆桌对话:异构算力下的推理效能革命

圆桌环节由沐曦 AI 研究院院长李兆石主持,童心源、常怀鑫、马腾、陈凯悦与沐曦股份 SGLang 项目核心开发者王志鹏五位技术专家共同参与,围绕“异构算力下的推理效能革命:SGLang 前沿优化与企业落地实践”展开讨论。针对百万长下文的 KV Cache 利用策略、AI 存储需求的趋势走向、AI 云端与本地部署的方案选择等热点话题,圆桌嘉宾分享了各自的洞察与思考。

本次 SGLang 技术交流 Meetup 是龙蜥社区生态伙伴在开源生态建设中的一次深度实践。未来,龙蜥社区将携手更多生态伙伴,在推理性能优化、模型适配广度、开发者工具链等维度持续深化协作,共同推进 AI 推理技术从“可用”走向“好用”。


最后,感谢本次活动各位嘉宾的精彩演讲,感谢沐曦股份与龙蜥社区工作人员:范佳璐、陈韵霏、蒙秋红、刘瑞刚、李彪、章津楠、杨仰、蔡佳丽、金美琴、倪俊雄、袁艳桃等人对本场活动的组织和支持;也特别感谢 InfoQ、51CTO、阿里云 AI 生产力 Live 等媒体的支持,使得本次 SGLang MeetUp 圆满举办。


PPT、视频回放获取

本次 MeetUp  PPT、视频回放已上传龙蜥官网,欢迎点击查看:

PPT 下载链接:https://docs.openanolis.cn/document/detail/rpzigrnb

视频回放:https://openanolis.cn/video/#1644020499070544368


附活动现场精彩集锦:

—— 完 ——


相关文章
|
4天前
|
人工智能 前端开发 数据挖掘
全链路实战:依托Codex完成PPT、数据分析、网页与APP一站式AI开发教程
在AI技术飞速迭代的当下,代码生成早已不是AI工具的单一能力边界。OpenAI旗下的Codex经过持续升级,如今已经成长为一款综合性智能生产力平台,除了经典的代码编写能力外,还支持插件调用、电脑远程操控、数据分析、多媒体制作、全品类应用开发等多元功能。本文将结合完整实操流程,一步步演示如何使用Codex完成PPT制作、体育赛事数据分析预测、网页开发以及移动端APP开发四大核心场景,全程记录操作指令、执行过程、代码实现以及问题优化方案,直观展现AI如何重塑传统工作与开发流程,同时剖析这套全链路AI工作模式的优势与现存局限。整套流程无需深厚的专业功底,普通办公人员、初级开发者都可以参考落地。
164 1
|
JSON 自然语言处理 Java
【AgentScope Java新手村系列】(4)结构化输出
结构化输出 — JSON Schema 约束 LLM 输出格式,直接反序列化为 Java POJO,打通文本到对象的转换。
98 0
|
4天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
4天前
|
人工智能 API iOS开发
零门槛配置指南:借助DeepCodex实现Codex无缝对接DeepSeek大模型,让AI编程助手自由切换模型
在当下的编程领域,AI编程助手已经成为开发者提升编码效率、排查代码漏洞、学习新语法的核心工具。Codex桌面端凭借出色的代码理解、生成与调试能力,收获了大量开发者的青睐。不过不少用户在使用过程中都会产生同一个想法:将Codex默认的底层模型替换为日常使用更顺手的DeepSeek模型。但二者采用了不同的接口协议,普通用户想要手动完成协议适配、接口配置、模型切换等一系列操作,不仅步骤繁琐,还极易因参数配置错误导致调用失败,对于编程新手而言更是难以独立完成。为了解决这一痛点,DeepCodex应运而生,它通过在本地搭建轻量级桥接服务,自动完成两大模型之间的协议转换,同时提供可视化命令行菜单,实现一键
326 0
|
4天前
|
人工智能 JavaScript API
从 OpenClaw 到 Hermes Agent:安装、迁移、配置、实战演示
Hermes Agent 是 Nous Research 推出的自进化 AI Agent,首创内置学习闭环:能从经验中自动创建技能、持续优化、主动记忆(MEMORY.md/USER.md)、跨会话深化用户理解,并支持多平台、多模型及低配部署。(239字)
103 7
|
4天前
|
人工智能 小程序 安全
个人全栈开发实战 依靠口述编程完成外包小程序项目
作为独立全栈开发者,我以“口述需求→AI生成→迭代优化”为日常核心工作流。TRAE凭借98%代码准确率、多模型切换、免费永久使用及优秀中文理解能力,完美适配小程序与后端外包开发,显著提升30%+效率,大幅降低单人全栈交付门槛。(239字)
|
4天前
|
存储 人工智能 自然语言处理
Skills实战:从0到1封装一个“登录鉴权”Skill,拿来即用
本文直击AI Agent落地痛点——登录鉴权失效、状态丢失、提示词不可靠。提出以“Skill”替代传统提示词工程:将动态认证逻辑(如Token获取/刷新/存储)封装为可复用、带状态管理的代码模块,实现跨会话稳定调用。实战拆解Skill四要素,揭示其如何让AI“一次登录,全程无忧”。
|
4天前
|
移动开发 供应链 小程序
从平台抽佣到独立运营:外卖商家如何自建外卖跑腿平台?
平台抽佣不断上涨,越来越多餐饮、生鲜、商超等商家开始布局自建外卖跑腿平台。本文围绕外卖系统开发、外卖APP开发、外卖小程序开发、跑腿配送系统源码搭建等内容,分析商家独立运营的优势,并介绍自建外卖平台的核心功能与应用价值。
|
4天前
|
人工智能 缓存 监控
构建企业级 AI Agent 工程化实践:从原型到生产环境的跨越
本文深入探讨企业级AI Agent从原型到生产的工程化实践,直面LLM概率性与业务确定性的根本矛盾,提出“LLM负责感知推理、代码保障逻辑执行”的混合架构。系统阐述可观测性、安全护栏、性能优化、数据管理四大工程支柱,并结合IT运维、金融合规等实战场景,提供可落地的LLMOps方法论。
|
4天前
|
人工智能 监控 Java
龙蜥两大委员会5月工作会议召开:CXL SIG 新项目开源,全力推动 AI Agent 生态变革
两个会上总结和回顾了龙蜥社区技术贡献、近期运营目标进展。

热门文章

最新文章