首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

英伟达重磅CPU Vera交付:专为智能体AI设计 甲骨文承诺部署数十万颗|gpu|黄仁勋|知名企业|甲骨文公司

《科创板日报》5月19日讯(编辑 宋子乔) 当地时间5月18日,英伟达正式宣布,其首款专为Agentic AI(智能体AI)设计的CPU——Vera,已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付


这款在今年3月GTC大会上亮相的重磅芯片,正式从英伟达的实验室走向了生产前线,首批交付过程充满了硅谷特有的仪式感。

上周五,英伟达副总裁伊恩•巴克亲自“开车送货”,第一站是Anthropic位于旧金山SoMa区的办公室,其计算负责人詹姆斯•布拉德伯里接收了服务器;在OpenAI的总部,巴克甚至掏出螺丝刀,当场打开机箱盖展示内部结构;当天行程的终点是帕洛阿尔托的SpaceX AI办公室,埃隆•马斯克亲自签收,并在现场详细询问了核心数量、内存布局及散热方案,SpaceX AI正计划将Vera用于强化学习工作负载与智能体仿真管线。




本周一,甲骨文产品管理负责人卡兰•巴塔在接收现场透露,“甲骨文云基础设施(OCI)计划从2026年开始部署数十万颗英伟达Vera CPU。Agentic AI需要在大规模下维持持续性能,Vera的架构专为高吞吐推理设计,这正是我们为下一代企业AI提供动力所需的效率。”


Agent AI并非仅靠GPU运行。每个代理沙箱、每次工具调用、每个编排层、每次长上下文检索操作都需要CPU处理。

Vera旨在满足Agent AI对CPU的需求,黄仁勋在本届GTC大会上将其定位为公司"下一个数十亿美元级业务"

与传统CPU设计追求“核心数量”最大化不同,Vera专为高吞吐推理、工具调用及代码生成设计。它搭载了88个英伟达自研的奥林巴斯(Olympus)核心,满载情况下单核性能较前代Grace提升50%,内存带宽高达1.2 TB/s,同时支持FP8精度,可直接承接AI推理与强化学习任务,无需GPU中转数据,可大幅提升AI流水线整体效率。

黄仁勋曾指出,当企业坐拥价值500亿美元的GPU时,绝不能让它们因为CPU处理速度慢而闲置。Vera存在的意义,就是当AI智能体需要同时处理规划任务、检索长上下文或调用API时,以极致的单线程性能和能效,让昂贵的GPU满负荷运转。

另外,Vera不仅是独立的CPU产品,它还将作为即将发布的Vera Rubin超级芯片平台的主机处理器,通过NVLink-C2C与两颗Rubin GPU配对,形成统一内存架构,以更高的能效为AI工厂供能。这种“CPU+GPU”异构协同的全栈AI算力方案,有望推动英伟达从单一GPU厂商向全栈AI计算平台提供商转型。

英伟达表示,Vera的高速核心与互连设计能够以传统基础设施两倍的能效,完成向GPU馈送数据所需的调度、控制与数据搬移工作

📚 相关阅读

• 航天事业再创辉煌空间站建设稳步推进
• 中国移动发布灵犀机器人家族 中尺寸人形机器人售价22.9万元/台|通信|机器狗|人机交互|视障人士|知名企业
• 理想汽车指控网络水军组织化 拉踩 i6 和 L6 车型|mc
• 力源信息旗下武汉芯源半导体官宣全系产品调价|全系列
• 出海日报 | 斯泰兰蒂斯与东风推进“中国制造、全球销售”,零跑海外销量占比升至37%|海信|李柯|比亚迪|东风集团|全球销量|知名企业
• 百度加入本地生活混战 以搜索+AI“卷土再来”|美团|高德|小红书|百度地图|用户需求|知名企业