Back to Feed
总结
英伟达CEO黄仁勋在2025年CES宣布,下一代“Vera Rubin”芯片平台已进入全面投产,预计今年晚些时候上市。平台由六颗独立芯片组成,旗舰服务器含72个GPU和36个CPU;面向聊天机器人等推理场景,计算性能称较前代提升5倍、生成Token效率提升10倍,主要依赖专有数据格式而非晶体管倍增。公司还推出“上下文记忆存储”与共封装光学交换机,CoreWeave将率先采用,微软等亦计划部署,并开源发布Alpamayo自动驾驶软件与训练数据;同时正申请向中国出口H200的许可。
正文
🚀 英伟达发布下一代Vera Rubin平台:性能提升五倍并已进入全面投产 核心发布:Vera Rubin 平台进入全面投产 英伟达(Nvidia)首席执行官黄仁勋在 2025 年国际消费电子展(CES)上宣布,公司下一代"Vera Rubin"芯片平台已进入全面投产阶段,预计将于今年晚些时候上市。该平台由六种独立芯片组成,其旗舰服务器配置了 72 个图形处理器(GPU)和 36 个中央处理器(CPU)。黄仁勋指出,在运行聊天机器人等 AI 应用时,新芯片的计算性能是前代产品的 5 倍,生成"Token"(AI 系统的基本单位)的效率提升了 10 倍。尽管晶体管数量仅为前代的 1.6 倍,但通过采用一种专有的数据格式,实现了性能的提升。 技术创新与行业应用 针对 AI 推理任务,英伟达推出了"上下文记忆存储"(context memory storage)技术,旨在缩短聊天机器人处理长难问题的响应时间。同时,公司发布了采用"共封装光学"(co-packaged optics)技术的新一代网络交换机,用于连接成千上万台机器。CoreWeave 将成为首批采用 Vera Rubin 系统的公司,微软、甲骨文、亚马逊和谷歌母公司 Alphabet 也预计将部署该系统。在自动驾驶领域,英伟达宣布将广泛发布 Alpamayo 软件及其训练数据,通过开源方式供汽车制造商进行评估。 市场竞争与出口动态 面对来自 AMD 和谷歌等对手的竞争,英伟达近期吸收了初创公司 Groq 的人才与技术。黄仁勋表示,此举不会影响核心业务,但可能带来扩展产品线的新产品。在国际贸易方面,英伟达确认中国市场对 H200 芯片的需求强劲。首席财务官科莱特·克雷斯(Colette Kress)透露,公司已提交向中国出口该芯片的许可申请,目前正在等待美国及其他政府的审批。 (@Reuters China)
发布时间: