英伟达 Vera Rubin 架构,推理成本降低 10 倍的下一代 AI 超级计算机公开

NVIDIA 发布了下一代 AI 超级计算机平台“Vera Rubin”。目标是将推理性能提升至 Blackwell 的 5 倍,并将每个 token 的成本降低至 1/10。预计将于 2026 年下半年发布,为 AI 计算提出了新的标准。

在 CES 2026 上发布的 Vera Rubin 平台由总共 6 个新芯片组成。根据 NVIDIA 官方公告,Rubin GPU 和 Vera CPU 结合的 NVL72 랙 스케일 构成是核心。该构成将 72 个 GPU 捆绑到一个系统中,以处理大规模 AI 模型的推理任务。尤其值得关注的是经济性。根据 Tom’s Hardware 报道,与 Blackwell 架构相比,每个 token 的成本可以降低 10 倍。对于 AI 服务运营企业来说,推理成本是最大的负担之一,如果这个数字能够实现,预计将对整个行业产生相当大的影响。Vera CPU 采用基于 ARM 的架构,也提高了能效。通过 NVLink 第 6 代互连,GPU 之间的通信带宽也大大扩展。 NVIDIA 博客解释说,Rubin 平台是涵盖自动驾驶、开放模型生态系统等蓝图的一部分。这表明,NVIDIA 的战略不仅在于提高硬件性能,还在于重新设计整个 AI 基础设施。

Vera Rubin 的出现有可能从根本上改变 AI 行业的成本结构。如果推理成本真的降低 10 倍,那么中小企业也可以运营大规模 AI 服务的时代将会到来。当然,实际性能需要在发布后进行验证,但 NVIDIA 的路线图将再次重塑行业标准这一点是显而易见的。下半年发布后,云服务提供商的采用速度将是关键。

FAQ

Q: NVIDIA Vera Rubin 何时发布?

A: NVIDIA 预计将于 2026 年下半年发布。具体月份尚未公布。

Q: 与 Blackwell 相比,有哪些改进?

A: 推理性能提高了最多 5 倍,每个 token 的成本降低到 1/10。NVLink 第 6 代和基于 ARM 的 Vera CPU 也被全新引入。

Q: Vera Rubin NVL72 构成是什么?

A: 这是将 72 个 Rubin GPU 集成到一个 랙 스케일 系统中的构成。它旨在在一个系统中处理大规模 AI 模型的学习和推理。

发表评论