英伟达2026年的首场重头戏比以往来得更早。
当地时间1月5日,在美国CES上,黄仁勋出乎意料地提前发布了下一代AI芯片平台“Rubin”,打破了英伟达通常在每年3月GTC大会上集中公布新一代架构的传统。
AI竞赛进入推理时代,英伟达决定加速出击。

Rubin并非空降。
早在2025年3月的GTC大会上,黄仁勋就已预告了代号“Vera Rubin”的超级芯片,并明确其将于2026年量产。
此次在CES上,黄仁勋对Rubin平台进行了系统性发布,Rubin成为英伟达最新GPU的代号。
“Rubin的到来正逢其时。无论是训练还是推理,AI对计算的需求都在急剧攀升。”黄仁勋表示,“我们坚持每年推出新一代AI超级计算机,通过六颗全新芯片的极致协同设计,Rubin正在向AI的下一个前沿迈出巨大一步。”

Rubin平台采用极端协同设计理念,整合了6颗芯片,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换芯片,覆盖了从计算、网络到存储与安全的多个层级。
相比前代Blackwell架构,Rubin加速器在AI训练性能上提升3.5倍,运行性能提升5倍,并配备拥有88个核心的新款中央处理器(CPU)。
相比英伟达Blackwell平台,Rubin平台实现推理token成本最高可降低10倍,训练MoE(专家混合)模型所需GPU数量减少4倍。
同时,Vera Rubin NVL72机柜级系统和平台同步发布,命名上非外界预计的NVL144。对此,英伟达高管在沟通会上向21世纪经济报道等记者指出,NVL72指的是72个GPU封装单元,每个封装内部包含2个Rubin Die,因此系统中实际包含144个Rubin Die,这并不意味着系统规模变化。
在生态层面,Rubin已获得头部云厂商和模型公司的集中响应。AWS、Microsoft、Google、OpenAI、Anthropic、Meta、xAI、CoreWeave等均被列入首批采用名单。
Rubin在CES的提前亮相,也引发了外界对英伟达产品发布节奏变化的关注。对此,英伟达高管回应称,目前构成Vera Rubin平台的六颗芯片已经全部到位,相关系统已在运行真实应用负载,并取得了积极结果。
此次在CES上提前披露Rubin,主要是为了尽早向生态伙伴提供工程样品,方便其为后续部署和规模化应用做准备。英伟达同时强调,Rubin仍将按照既定节奏推进,计划在今年下半年进入量产爬坡阶段,这一时间安排与此前披露的路线图保持一致。
随着Rubin平台的规模化部署,AI产业将迎来新一轮创新爆发期。更低的成本、更强的性能、更便捷的获取方式,将激活更多行业的AI应用潜力,推动数字经济与实体经济深度融合。这场由Rubin引领的算力革命,正重塑全球科技产业的竞争格局。
*声明:我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台,侵权立删。