黄仁勋在GTC宣判了训练时代的死亡

简介: 3月17日,黄仁勋站在GTC 2026的舞台上,讲了将近两个小时。他说了两句话,足以让整个行业坐立不安。

3月17日,黄仁勋站在GTC 2026的舞台上,讲了将近两个小时。

他说了两句话,足以让整个行业坐立不安。

第一句:黄仁勋在GTC上给出了一个数字:推理算力的需求,将比训练高出1000倍。

第二句:所有SaaS公司都将消失。

这不是危言耸听。这是一位用三十余年把英伟达从游戏显卡厂商变成全球AI基础设施核心供应商的人,对接下来这个时代,给出的最直接判断。

一、推理需求为何是1000倍?

在GTC 2026之前,整个AI产业的竞争焦点是训练。谁能用更少时间训练更大的模型,谁就站在食物链顶端。大模型参数量从百亿飙到万亿,GPU集群从几千张扩张到十几万张。“用多少算力训练了多少token”,成了衡量一家AI公司实力的核心指标。

这套逻辑在训练时代是对的。但它忽略了一件事:训练是一次性的,推理是持续的。

想象一下:GPT-4这类大模型,从训练到发布,只需要训练一次。但一旦部署,每天响应的用户请求可能是数以亿计。每一次对话、每一次搜索、每一次代码补全,背后都是一次推理计算。用户规模越大,推理需求越高;应用场景越多,推理需求越高;AI深入业务流程的程度越深,推理需求越高。

再叠加一个更关键的变量:AI智能体(Agent)。

传统AI应用,用户问一句,模型答一句,一次推理。但Agent是不同的——它需要感知环境、制定计划、调用工具、执行步骤、验证结果。完成一个复杂任务,可能需要成百上千次推理调用。黄仁勋在GTC上的判断是:未来企业的每一个业务流程,都将由AI智能体来完成。

训练,是一次性的。推理,是持续的、指数级增长的。

这就是为什么是1000倍。

二、Token工厂:CEO们要学会管算力产能了

黄仁勋在GTC上抛出了一个极具破坏力的新概念:Token工厂。

他说:“未来,全球的CEO将像管理产能一样管理Token输出率。”

这句话描述的是一种正在发生的现实。过去,企业的核心资产是数据、人才、品牌。未来,将再加上一项:Token产能——你的AI系统每秒能处理多少推理,每次推理的成本是多少,延迟是多少。这将直接决定你的业务响应速度、客户体验质量,以及整个运营成本结构。

然后,黄仁勋在台上公布了一个数字。

这个数字,让台下沉默了一秒。

Vera Rubin平台,将单token推理成本降至上一代的十分之一。

成本下降90%,意味着什么?

意味着过去因为“太贵而无法规模化”的AI应用场景,将集中爆发。医院可以给每个病历配一个AI助诊;教育平台可以给每个学生提供真正个性化的实时辅导;每一家企业的每一条工作流,都可以被AI智能体接管。被Token成本压制的一切需求,即将被集中释放。

黄仁勋把这个时代叫做“推理时代”,但更精准的描述或许是:AI从“精英特权”变成“基础设施”的时代。

三、SaaS的葬礼

“所有SaaS公司都将消失。”

这是GTC 2026全场最炸裂的一句话,也是最容易被误读的一句话。

黄仁勋的意思不是说软件会消失,而是说:传统SaaS的商业模式,将被AI Agent从根本上瓦解。

理解这个判断,需要先理解SaaS的本质。SaaS的核心逻辑是:把一种标准化的软件能力,通过订阅的方式持续出售给用户。你买的是“功能”——CRM的客户管理功能、ERP的财务管理功能、项目管理工具的协作功能。

但AI Agent出现之后,这个逻辑被釜底抽薪了。

Agent不购买“功能”,Agent完成“任务”。你不需要一个CRM系统来管理客户,你只需要一个Agent,告诉它“帮我跟进这100个潜在客户”,它会自己调用各种工具、发邮件、安排日程、更新记录、生成报告。它完成的是结果,而不是使用一个界面。

这意味着,过去软件公司卖的那层“功能封装”,将逐渐变得透明、可替代。未来的软件竞争,不是“谁的界面更好用”,而是“谁的Agent能力更强、执行更可靠、成本更低”。

这是黄仁勋在GTC上反复提到「OpenClaw是个人AI时代的操作系统」的底层逻辑——操作系统级别的基础设施,从来不向上层应用妥协。 它只会替代它们。

四、英伟达押注的不是芯片,是重写世界的基础设施话语权

理解了前三点,再来看GTC的核心发布,你会看到一个完全不同的逻辑。

这些发布背后,有一个统一的战略意图:把推理时代的每一层基础设施,全部纳入英伟达的版图。

这次的主角是Vera Rubin平台——它已经不是一颗芯片,甚至不是一个芯片系列,而是一套完整的AI超算基础设施体系:Vera CPU、Rubin GPU、NVLink 6高速互联、ConnectX-9超级网卡、BlueField-4数据处理单元,加上今年首次整合进来的Groq 3 LPU。

Groq是一家专注推理加速的公司,英伟达去年12月以约200亿美元与Groq签署技术授权协议,并引入其核心团队。Groq 3 LPU做的那件事,可以这样理解:过去GPU做推理,像一辆性能优异但路况受限的赛车;Groq 3 LPU的加入,是给这辆赛车单独修了一条极速专用道——专为AI智能体高并发、低延迟的场景设计,带宽是同类HBM4的近7倍。

还有一个发布,让人有点震惊:Vera Rubin Space Module。

英伟达把AI算力送上了太空。与H100相比,太空推理算力提升最高25倍。合作方是Axiom Space和Planet Labs。这不是噱头——现代地球观测卫星每天拍摄的图像数据,远超地面传输带宽。如果能在轨道上完成目标识别,只把“有价值的结论”传回地面,传输成本将大幅下降。AI算力的边界,正在从数据中心扩展到轨道空间。

支撑这一切的底座,是英伟达用20年时间打造的CUDA生态。黄仁勋多次强调,CUDA是推动加速计算的核心飞轮。这个飞轮的护城河,不仅仅是技术,更是20年里积累的开发者习惯、工具链、框架生态——这些东西,不是用钱或时间能复制的。

下一代架构“费曼”(Feynman)已经在路线图上:台积电1.6nm制程,引入光通信技术,黄仁勋说它将支撑“百万倍算力需求”。

英伟达的战略意图很清楚:用每一代架构,把竞争对手的追赶窗口压缩到极限。从地面到太空,从训练到推理,从硬件到软件栈——全覆盖。

结语:你的认知框架,过时了吗?

黄仁勋在GTC 2026用将近两个小时说了一件事:游戏规则变了。

但这件事的冲击力,不在于英伟达发布了什么,而在于它正在逼迫每一个置身AI行业的人,重新检视自己的认知框架。

如果你是一家企业的技术负责人,今天还在用“我们用了多少参数的模型、训练了多少数据”来衡量AI能力,那你的评估框架可能已经过时了。推理时代的核心竞争力是Token产能、推理延迟、单次调用成本——这些词,将越来越频繁地出现在你的技术评审会上。

如果你在做SaaS,今天还在迭代功能界面、优化用户体验流,那你需要认真想一个问题:当你的用户可以用一个Agent直接完成任务的时候,他们还需要你的界面吗?

如果你是一个技术人,今天的职业价值还建立在“我能实现这个功能”上,那你需要往上走一层:从实现者变成架构者,从功能交付者变成系统设计者,从执行Agent的人变成指挥Agent的人。

历史上,每一次基础设施的范式转移——从大型机到个人电脑,从本地软件到云计算——都曾经释放出数量级的新需求,也都曾经让一批没有及时迁移认知框架的人,从时代的中心滑落到边缘。

推理时代,已经开始了。

这不是黄仁勋的预言。这是一场已经开始的迁移,正在等待你决定:你站在新大陆上,还是还在旧船上?

参考来源:

英伟达GTC 2026大会,2026年3月17日,圣何塞

相关文章
|
17天前
|
弹性计算 人工智能 安全
想魔改 OpenClaw 给团队用?计算巢「克隆服务」帮你搞定
本文教你如何用阿里云计算巢的“克隆服务”功能,快速将二次开发的OpenClaw定制版打包为云上服务:克隆模板→制作自定义镜像→关联部署物→配置参数→测试发布,实现团队成员一键部署,省去手动配置烦恼。(239字)
156 0
|
23天前
|
存储 人工智能 关系型数据库
OpenClaw怎么可能没痛点?用RDS插件来释放OpenClaw全部潜力
OpenClaw插件是深度介入Agent生命周期的扩展机制,提供24个钩子,支持自动注入知识、持久化记忆等被动式干预。相比Skill/Tool,插件可主动在关键节点(如对话开始/结束)执行逻辑,适用于RAG增强、云化记忆等高级场景。
767 56
OpenClaw怎么可能没痛点?用RDS插件来释放OpenClaw全部潜力
|
3天前
|
人工智能 JSON 监控
Claude Code 源码泄露:一份价值亿元的 AI 工程公开课
我以为顶级 AI 产品的护城河是模型。读完这 51.2 万行泄露的源码,我发现自己错了。
3737 8
|
17天前
|
存储 算法 关系型数据库
吃透分布式 ID:雪花算法、号段模式的底层逻辑与全场景架构避坑
本文深度解析分布式ID两大主流方案——雪花算法与号段模式,涵盖核心设计准则(唯一性、趋势递增、高性能等)、底层原理、代码实现、6大生产避坑指南及场景化选型建议,助你构建稳定可靠的分布式ID服务。
329 3
|
17天前
|
人工智能 JavaScript Linux
OpenClaw从部署到上手实战指南:阿里云+本地部署、百炼API配置、首次任务实操全攻略
2026年,OpenClaw(Clawdbot)作为开源AI生产力工具的代表,凭借跨平台部署、灵活的任务执行能力,成为普通人提升效率、落地AI应用的核心工具。很多用户历经波折完成安装、解决报错、成功启动系统后,却会对着界面陷入迷茫——不知道下一步该做什么。其实问题的核心从不是“不会用”,而是“没有给工具一个明确的任务”。OpenClaw的价值从不是简单的问答,而是帮你完整完成一件事,而装好后的第一件事,从来不是啃文档、研究配置,而是立刻让它完成一个简单的小任务。
668 1
|
16天前
|
人工智能 Linux API
零基础用OpenClaw打造个人AI投研助手:零代码阿里云+本地部署、Tushare实战、百炼API配置攻略
近年来AI工具快速迭代,普通投资者与量化爱好者迫切需要低成本、高效率、零代码的投研工具。OpenClaw(原Clawdbot)凭借强大的Skill生态,成为个人投研领域的热门选择。搭配Tushare数据Skill,无需编写复杂代码,一句话即可完成A股财务对比、解禁查询、指数分析、价值选股等高频操作,效率较传统方式提升数十倍。本文将完整覆盖2026年最新版OpenClaw阿里云部署、本地MacOS/Linux/Windows11部署、阿里云百炼Coding Plan API免费配置、Tushare Skill安装与4大A股实战案例,同时附上常见问题解答,帮助你快速搭建专属AI投研助手。
871 3
|
19天前
|
人工智能 运维 监控
OpenClaw怎么部署?一键云端部署,小白也能轻松拥有专属AI助理!
还在为命令行和环境配置头疼?阿里云OpenClaw一键部署方案来了!无需代码基础,不碰复杂配置,点击几下鼠标,即可在云端快速拥有7×24小时在线的AI智能体——自动写代码、管文件、填表单、运维服务器,小白也能轻松上手!
225 7
|
17天前
|
安全 数据建模 测试技术
2026阿里云SSL证书价格全解析:免费版与付费版对比及申请指南
阿里云SSL证书提供免费DV单域名(Digicert,3个月)及多品牌付费方案(DV/OV/EV),覆盖测试到金融级安全需求。2026年价格透明,含WoSign、GlobalSign等国际品牌,新老用户享5折起优惠,申请流程一键便捷。(239字)
|
16天前
|
人工智能 Linux API
不辞职、不烧钱!从零搭建AI一人公司(OPC):OpenClaw落地+全平台部署+免费模型一站式教程
2026年,AI一人公司(OPC)已经不是概念风口,而是普通人最低成本、最低风险的创业新模式。不辞职、不烧钱、不组建团队,只用业余时间,就能依靠OpenClaw这类AI智能体搭建属于自己的自动化数字员工体系,完成内容生产、客户服务、数据处理、营销获客、研报产出等全流程工作。但行业数据显示,AI创业失败率高达80%~90%,核心原因是盲目跟风、没有验证闭环、忽略合规与风险、缺乏系统化执行路径。
691 8
|
23天前
|
Arthas 人工智能 Java
我们做了比你更懂 Java 的 AI-Agent -- Arthas Agent
Arthas Agent 是基于阿里开源Java诊断工具Arthas的AI智能助手,支持自然语言提问,自动匹配排障技能、生成安全可控命令、循证推进并输出结构化报告,大幅降低线上问题定位门槛。
747 64
我们做了比你更懂 Java 的 AI-Agent -- Arthas Agent