SRAM 想抢 HBM 的饭碗？英伟达黄仁勋：应用于 AI 芯片容量瓶颈是硬伤

Back to Feed

Notable

国际 · 科技

CES 2026开幕

总结

Tom's Hardware 报道称，在 CES 2026 期间的问答环节，英伟达 CEO 黄仁勋回应“用更廉价的 SRAM 取代昂贵 HBM”的讨论。他承认 SRAM 在部分工作负载下速度惊人，但强调其容量与密度难以跟上现代模型需求，能承载的模型规模仅为 HBM 系统的百分之一；一旦模型因上下文或功能扩展溢出 SRAM、转而访问外部内存，效率优势会迅速消失。黄仁勋还指出 AI 负载形态多变（MoE、多模态、扩散、自回归等），过度针对单一模式优化会导致芯片在共享数据中心中闲置。基于灵活性与“可选性”，英伟达仍押注 HBM，即便成本和系统复杂度更高；他并称开放模型并不降低基础设施内存需求，反而可能随上下文与模态扩展而上升。

正文

IT之家 1 月 8 日消息，科技媒体 Tom's Hardware 今天（1 月 8 日）发布博文，报道称在 CES 2026 展会期间的问答环节，英伟达首席执行官黄仁勋针对" 是否用更廉价的 SRAM 取代昂贵的 HBM "这一行业热点进行了回应。 IT之家注：SRAM 全称为 Static Random Access Memory，直译为静态随机存取存储器，是高速小容量的静态缓存，基于触发器，速度极快但成本高、密度低；HBM 是超高带宽、大容量的 3D 堆叠式主存（基于 DRAM），通过垂直堆叠实现超高带宽，功耗低、容量大，主要用于 AI / GPU，两者定位不同，SRAM 是片上缓存，HBM 是系统级高带宽内存，共同服务 AI 算力需求。 AI 行业当前正积极寻找降低成本的途径。随着 SRAM 加速器、GDDR 推理方案以及开放权重模型的兴起，业界出现了一种声音，认为这些低成本方案可以缓解对英伟达昂贵组件的依赖。特别是在基准测试（Benchmark）和受控演示中，SRAM 凭借极高的访问速度和无延迟特性，展现出了诱人的性能优势，甚至被视为 HBM 的潜在替代者。黄仁勋并未否认 SRAM 的速度优势。他直言：" 对于某些特定工作负载，SRAM 快得惊人。 "然而，一旦进入生产级 AI 系统，SRAM 的优势便会因容量瓶颈而崩塌。黄仁勋指出，SRAM 的容量增长速度远跟不上现代模型的需求，其可容纳的模型规模仅为 HBM 系统的百分之一。在模型因上下文增加或功能扩展而溢出 SRAM 时，系统被迫调用外部内存，导致效率优势瞬间消失。黄仁勋进一步剖析了 AI 工作负载的不可预测性。现代 AI 模型形态各异，包含混合专家模型（MOE）、多模态任务、扩散模型及自回归模型等。这些架构对硬件的压力点截然不同：有的依赖显存容量，有的依赖互连带宽（NVLink），且需求时刻在变。如果硬件针对某一特定模式（如纯 SRAM）过度优化，一旦工作负载发生变化，昂贵的芯片就会闲置。基于此，英伟达坚持选择 HBM 路线。黄仁勋认为，在共享数据中心中，灵活性是决定经济效益的关键。即使某种专用硬件在 5%-10% 的任务中表现极致，但如果无法处理其余 90% 的通用任务，就会造成巨大的资源浪费。相比之下，HBM 方案虽然物料成本更高，但能适应不断变化的算法和模型架构，确保硬件在数周甚至数月的运营周期内保持高利用率。针对"开放模型是否会削弱英伟达壁垒"的提问，黄仁勋表示，开放并不意味着降低基础设施要求。随着开放模型整合更长的上下文和更多模态，其内存占用同样会激增。英伟达愿意承担高昂的 HBM 成本和复杂的系统设计，正是为了保留"可选性"（Optionality），既防止客户被锁定在狭窄的性能范围内，也保护自身硬件免受模型架构快速迭代的冲击。

发布时间：-