英伟达Rubin架构正式取代Blackwell,以更快的训练速度、更强的推理能力,以及专为长上下文多智能体AI系统设计的BlueField赋能存储方案,开启新时代。
英伟达今日在2026年国际消费电子展上正式发布新一代Rubin计算架构,定位为该公司迄今为止最先进的人工智能硬件平台。
首席执行官黄仁勋表示,Rubin架构已进入全面量产阶段,并将在下半年进一步扩大规模,彰显了英伟达对市场需求的信心。
黄仁勋指出,Rubin是对人工智能工作负载爆炸式增长的直接回应,尤其针对大规模训练和长周期推理任务。他向观众强调,人工智能计算能力必须以空前速度持续提升。
此次更新延续了英伟达快速的硬件迭代节奏,正是这种节奏助力该公司成长为全球市值最高的企业。
Rubin以天文学家薇拉·鲁宾命名,采用六芯片架构设计,可作为统一系统协同工作。
英伟达重新设计了NVLink以解决大型集群间的通信瓶颈,同时扩展了BlueField数据处理平台,以应对先进AI系统日益增长的内存需求。
英伟达将其设计为支持具备长期规划、上下文记忆与持续行动能力的人工智能系统。
Rubin系统已确定将在整个人工智能生态中部署。包括Anthropic、OpenAI和亚马逊云科技在内的云服务合作伙伴计划采用该平台。
英伟达还确认,Rubin将为惠普企业的蓝狮超级计算机以及劳伦斯伯克利国家实验室即将推出的Doudna系统提供算力支持。
英伟达宣称Rubin相较Blackwell实现显著性能提升。内部测试显示训练性能最高提升3.5倍,推理速度加快5倍。
能效也大幅改善。据英伟达称,Rubin每瓦特提供的推理算力最高提升至8倍。
这些进步具有重要意义——当前全球人工智能基础设施正对电网和数据中心预算造成巨大压力。
黄仁勋曾预估,未来五年全球AI基础设施支出可能达到3万亿至4万亿美元。Rubin架构正是为此规模而生。
伴随Rubin架构,英伟达推出了由BlueField-4驱动的全新AI原生存储方案。
推理上下文内存存储平台致力于解决AI系统中日益突出的问题:管理海量键值缓存。
当AI智能体处理长对话和多步骤推理时,会产生无法永久驻留于GPU的上下文数据。
该平台采用Spectrum-X以太网和英伟达DOCA框架,实现跨机架系统的上下文共享。据称,其令牌吞吐量和能效比传统存储方案最高提升5倍。
基于BlueField-4的系统将于2026年下半年交付合作伙伴,标志着英伟达正深度拓展全栈AI基础设施布局。大游中国股份有限公司大游中国股份有限公司