大模型云服务产品已上线!一键接入DeepSeek-V4、Kimi-K2.6等海量模型,按量计费,稳定易用, 立即体验
共绩算力

黄仁勋台北 GTC 2026:英伟达从 GPU 公司变成了 AI 房东


一、先说结论:对 AI 开发者意味着什么

如果你是写模型、调 Agent、管集群、或者在为公司挑算力的,这场演讲翻译成一句话就是:

“以后你做的每一个 AI 系统,都将默认跑在英伟达定义的全栈之上 —— 除非你愿意花 3 倍力气自己拼。”

这不是危言耸听。黄仁勋在演讲里给出的四个数字,几乎锁死了未来 18 个月的算力采购逻辑:

关键数字

出处

对开发者的含义

1 吉瓦 AI 工厂造价 500-600 亿美元,即将破千亿

黄仁勋演讲

算力从"成本项"升级为"资本品",采购周期以年计

Vera Rubin 单机架组装时间 2 小时 → 5 分钟(无缆化 midplane)

黄仁勋演讲

部署时间窗口变短,但单点故障半径变大

智能体系统一次调用激活整套 Vera Rubin NVL72

黄仁勋演讲

不是"GPU 按卡卖",是"按机架批"

Nemotron 3 Ultra 推理速度 5 倍、推理总成本 -30%

据演讲披露

开源基座第一次在工程指标上正面打 OpenAI/Anthropic

下面进入正题,我们分七层拆。


二、智能体 AI 已经”有用”,GitHub Commit 翻三倍不是噱头

黄仁勋开场给了一组 GitHub 数据:2023 年约 3 亿次代码提交,2026 年初已接近 9 亿次。他用这个推导出”3 万亿美元工程师工资,现在产出 9 万亿美元价值”。

听起来像 PPT 话术,但我们站在开发者视角翻译一下:

但要警惕一个反向风险:Agent 编码工具的同质化会让”普通工程师”溢价消失,真正稀缺的是”能设计 Agent 协作流程、能兜底 Agent 翻车”的人。短期看代码量翻倍,长期看代码审查工作量会爆炸。


三、智能体架构:本质是一个新的 OS

黄仁勋把”智能体”画成了下面这张图,我用开发者语言重写一下:

传统应用:用户 → 应用 → OS → 硬件
智能体应用:用户 → Agent(LLM + Harness)→ Tools(数据库/浏览器/编译器)→ 硬件

Harness(框架) 负责四件事:观察 (Observe)、推理 (Reason)、行动 (Act)、用工具 (Use Tools)。Agent 还具备两类记忆:

这意味着对算力的需求结构变了:

这就是为什么英伟达要自己造 CPU:智能体活在纳秒级,而 x86 活在秒级。Vera CPU 88 核 Olympus 架构、3.6 TB/s 网格带宽、1.2 TB/s LPDDR5X 内存,SQL 查询快 3 倍、NYSE 实时流处理快 6 倍 —— 这些数字直接对应”Agent 每一步工具调用的等待时间”。

开发者启示:


四、Vera Rubin:为 Agent 而造,而不是为训练而造

Vera Rubin 这代架构,黄仁勋明确说”不是训练芯片,是 Agent 芯片”。它由五个相互连接的机架级子系统组成:

  1. Rubin GPU(NVL72):NVLink 72 互连,72 颗 GPU 共享内存一致性
  2. Vera CPU:Olympus 88 核,1.2 TB/s 内存,3.6 TB/s 网格
  3. ConnectX-9 网络:800 Gb/s 互联
  4. Spectrum-X 交换机:全球首款 200Gb CPO 共封装光学以太网交换机
  5. BlueField-4 DPU:负责静态/传输中/使用中数据加密,机密计算标准

工程上最值得关注的两个数字:

锐评:5 分钟装一个机架是好事也是坏事。好事是部署快,坏事是单点故障的”爆炸半径”变大。一个 midplane 出问题可能影响整柜 72 颗 GPU。SRE 团队需要为 Vera Rubin 时代重新设计 HA 拓扑,以前 Grace Hopper 时代”坏一两颗 GPU 不影响训练”的容错哲学可能要改。


五、DSX:英伟达开始卖”工厂蓝图”,这才是真正的锁定

这是整场演讲最值得警惕的部分。

过去客户买 GPU 自己搭集群,现在英伟达提供从参考设计、仿真、能源管理到运营系统的全栈方案,叫 DSX(AI 工厂基础设施蓝图)。分四层:

层级

作用

类比

DSX Sim

在 Omniverse 数字孪生里验证电力/冷却/网络

建筑师的 BIM 模型

DSX OS

工厂上电后接管资源调度、监控、自愈

数据中心的 Kubernetes

DSX MaxLPS

动态电力分配,提升每瓦 token 数

工厂的能源管理

DSX Flex

AI 工厂作为电网调峰资产

工厂反向售电

黄仁勋直言:1 吉瓦 AI 工厂造价已从 200-300 亿涨到 500-600 亿,很快到 800-1000 亿。“工厂必须一次成功”。

这里面的算盘是:

对开发者的影响 (很多团队意识不到):


六、企业 AI 工具包:开闭源博弈进入新阶段

英伟达这次把企业 Agent 生态拆成四件套:

组件

是什么

开源?

模型

Nemotron 3 Ultra + 兼容 Claude Code / Codex

Nemotron 全开源

框架

Open Shell(安全沙箱)+ Hermes

全开源

工具

CUDA-X 1000+ 加速库 (cuLitho / cuOpt / AIQ / Warp / Parabricks...)

闭源为主

运行时

跨云 / 本地 / 端侧

闭源为主

Nemotron 3 Ultra 是这次开源阵营的旗舰:基于 SSM(状态空间模型)+ MoE 混合架构,据称推理速度 5 倍、成本 -30%。全开源 (权重 + 训练数据 + 训练脚本)。

实操建议:


七、PC 再发明:RTX Spark 与 N1X 芯片 —— 端侧 Agent 的开端

这场演讲里最让 PC 圈炸锅的是 RTX Spark:

配套三款产品形态:

现场演示了一个颇为冲击的场景:在 RTX Spark 笔记本上跑 Hermes 框架,连接云端 Claude Sonnet,完成”草图 → 3D 建筑效果图”,Agent 自主调用 Rhino + Blender + Flux 2 协作。

对开发者的含义:

但请保持冷静:生态是关键。RTX Spark 要替代 MacBook Pro / ThinkPad,需要至少 18 个月的开发者生态沉淀,目前 CUDA-X 库的桌面端覆盖还很有限。


八、物理 AI:Cosmos 3 + Isaac GR00T —— 数据问题的解法

物理 AI(机器人 / 自动驾驶) 最大的痛点是第一人称视角数据极度稀缺 (YouTube 上几乎全是第三人称)。

英伟达的解法是 Cosmos 3:

配套两个产品:

实操建议:


九、给 AI 开发者 / 算力买家的 5 条行动建议

最后给个 checklist:

  1. 选型时,盯”端到端 P99 延迟”而不是”单卡 FPS”。Agent 时代的工作负载 = LLM 推理 + 工具调用 + 记忆检索,任何一个环节慢都会卡住整个调用链。
  2. 评估 Nemotron 3 Ultra 至少做一次 PoC。尤其是涉及私有化、合规、成本敏感的场景,SSM+MoE 混合架构的开源模型值得测。
  3. 10MW 以上的自建机房必须先用 DSX Sim 跑一遍。即使最终不全用英伟达方案,这个数字孪生能帮你省下几千万的试错成本。
  4. 本地 Agent 场景认真评估 RTX Spark。但别在 2026 年内押注,等 2027 年第二代产品 + 生态成熟再 All-in。
  5. 重新审视 x86 CPU 在 Agent sandbox 中的角色。Vera CPU 给出了一个明确信号:未来的 CPU 需要为纳秒级响应设计,不是为人机交互设计。短期 x86 仍是主流,但建议在采购清单里加一列”ARM/NVIDIA 选项”。

写在最后

黄仁勋在演讲结尾说了一句话,大意是:“十年后,家庭 AI 超级计算机会像家庭影院一样普及,持续运行你的智能体助手,越来越像 R2-D2,越来越像 C-3PO。”

这个愿景很美好。但作为开发者,我们应该清醒地看到另一面:

当英伟达从”卖铲子”变成”卖金矿”的时候,你买的每一把铲子,都在帮它把整个金矿圈起来。

DSX 是个伟大的产品,也是一副漂亮的金手铐。Vera CPU / RTX Spark / Cosmos 3 都在以”开源”为名,实质性扩大英伟达的事实标准。

未来 18 个月,我们会看到两种公司:

没有标准答案。但必须做选择,不能假装这个问题不存在。


数据来源:本文事实主要基于钛媒体《英伟达 GTC 2026:智能体 AI 时代,全栈战略正式落地》及多家中文媒体对黄仁勋 2026 年 6 月 1 日台北 GTC 演讲的转述,具体产品参数与基准测试数据以英伟达官方最终发布为准。 免责声明:本文为产业观察,不构成投资建议。

准备好开始您的 AI 之旅了吗?

读完这篇文章,想必您对 AI 技术有了更深的了解。现在就来体验共绩算力,让您的想法快速变成现实。

✓ 已有 10 万 + 开发者在使用

✓ 99.9% 服务可用性

✓ 开箱即用的容器托管