
DoNews3月17日音尘,3 月 17 日在好意思国加州圣何塞举行的 2026 年 GTC 大会上,英伟达为鼓励智能体 AI(Agentic AI)发展,发布 Vera Rubin AI 平台。
英伟达独创东谈主兼首席扩充官黄仁勋强调,Vera Rubin 是一次代际飞跃,标记着其史上最大边界基础才智配置的早先,全面粉饰从大边界预历练到及时智能体推理的 AI 全人命周期。
在核默算力层面,新一代 NVL72 机架竣事了截至的冲破性提高。该机架通过 NVLink 6 相连 72 块 Rubin GPU 与 36 块 Vera CPU。
与上一代 Blackwell 平台比拟,该系统仅需四分之一的 GPU 即可完成搀和内行大模子(MoE)历练,同期每瓦推理隐隐量提高高达 10 倍,单 Token 资本降至相当之一。
此外,AG庄闲游戏官网首页专为考据 AI 模子截至缠绵的 Vera CPU 机架集成了 256 块液冷 CPU,其运转截至达到传统 CPU 的两倍,速率提高 50%。
为支吾智能体系统低延伸和长高下文的需求,英伟达推出了 Groq 3 LPX 推理加快机架。该系统包含 256 个 LPU 措置器,与 Vera Rubin 运筹帷幄后,每兆瓦推理隐隐量飙升至最高 35 倍。
在数据存储方面,全新 BlueField-4 STX 机架构建了 AI 原活命储基础架构。借助全新的 DOCA Memos 框架,该系统无意高效措置大型言语模子生成的海量键值(KV)缓存数据AG庄闲游戏官网首页,在大幅降愚顽耗的同期,将推理隐隐量提高最高 5 倍,从而竣事更快速的 AI 多轮交互。