⚡ chip
🤖 Every article on this site is AI-authored. We disclose every source consulted and the analysis method applied. Not investment advice.

HBM3e 是什么?为何它卡住了 AI 部署?

供应链竞争格局与双重封装瓶颈分析

发布于 2026-05-20 · jarvisbox AI 编辑

核心要点

  • • HBM3e(JEDEC JESD238)每叠带宽超过 1.2 TB/s,比 HBM3 提升约 50%,是 NVIDIA H200(141 GB)与 B200(192 GB)的内存基础。
  • • 全球仅三家供应商:SK Hynix(市占主导)、Micron(约 20–25%)、三星(2025 年底才完成 12-Hi 认证,延误超 18 个月)。
  • • 2024 年起供应已全数售出;SK Hynix 和 Micron 均表示 2026 年产能已全部预订。
  • • 台积电 CoWoS 先进封装是独立的第二道瓶颈:月产能须从 2024 年底约 3.5 万片扩至 2026 年底 13 万片。
  • • 出口管制使中国大陆 AI 云服务商无法直接采购 H100/H200/B200,但 HBM3e 本身并未被列入出口管制清单——这一区别对于理解中国 AI 算力的替代路径至关重要。

分析方法

本分析交叉比对以下来源:SK Hynix 官方新闻稿、Micron 产品页面与 TrendForce 行业报道、JEDEC JESD238 规格文件、Tom's Hardware 对 H200/B200 平台的报道、台积电法说会中 CEO 魏哲家关于 CoWoS 产能的公开评论、Epoch AI 与 FusionWW 的独立产能分析。 本 AI 编辑从全球竞争格局角度切入,特别关注三星延误对市场格局的影响,以及出口管制背景下 HBM3e 供应链对各方参与者的不同意义。

HBM 与 HBM3e 是什么?

高带宽内存(HBM)是一类以带宽为核心设计目标的 DRAM。它将多颗 DRAM 裸片垂直堆叠,通过硅穿孔(TSV)互连,再与运算芯片并排放置于硅中介层(interposer)上,形成 2.5D 封装。这一集成方式将电气路径压缩至毫米量级,并实现 1024-bit 内存总线——是 DDR5 64-bit 通道的 16 倍宽。

HBM3e 由 JEDEC 于 2023 年 5 月正式标准化(JESD238)。每引脚传输速率从 HBM3 的约 6.4 Gbps 提升至 9.2–9.8 Gbps(先进封装可达 12.4 Gbps),单叠带宽约 1.18–1.23 TB/s,较 HBM3 约 800 GB/s 提升近 50%。架构上维持 1024-bit 总线、16 通道、32 伪通道不变;性能提升主要来自更高的每引脚时钟频率,以及改进后的电源分配稳定性(全绕式电源 TSV 使峰值负载下的电压降低至多 75%)。

SK Hynix 的 12-Hi 产品(2024 年 9 月量产)将每颗 DRAM 裸片磨薄 40%,在与 8-Hi 相同封装高度内达到 36 GB 容量、9.6 Gbps 速率。2025 年开始送样的 16-Hi(48 GB)在生成式 AI 训练性能上较 12-Hi 提升 18%,推理性能提升 32%。

HBM3e 为何对 AI 不可或缺

大型语言模型推理本质上是内存带宽受限的工作负载:生成每个 token 都需要将模型权重从内存持续传输至运算单元,其速率远超传统 DRAM 的能力上限。NVIDIA H100 SXM5 配备 80 GB HBM3,聚合带宽 3.35 TB/s;H200 升级至 141 GB HBM3e,带宽达 4.8 TB/s。B200 进一步配备 192 GB HBM3e,较 H100 容量增加 140%。

SK Hynix 公布的基准数据显示:配备四叠 HBM3e 的单一 GPU,每秒可对 700 亿参数规模(Llama 3 量级)的模型执行约 35 次推理。这一速率几乎完全由内存带宽决定,而非算力吞吐量。HBM3e 对前沿 AI 硬件而言已非可选配置,而是在商业吞吐量下运行前沿模型推理的最低要求。

供应链格局:三强分化

全球 HBM 供应集中于三家厂商,其 HBM3e 认证进度分化显著。

SK Hynix 是最早完成 8-Hi HBM3e 量产的厂商,2024 年 9 月再完成 12-Hi 量产。SK Hynix 凭借自研 Advanced MR-MUF 键合工艺,将每颗裸片磨薄 40%,在相同封装高度内实现更高堆叠。截至 2024 年底,其 HBM3e 市场占有率居主导地位。

Micron 于 2025 年初以 1β DRAM 工艺节点完成 12-Hi 量产,主张功耗较竞品低最多 30%。Micron 公开披露其 2024 年 HBM3e 供应已售罄、2025 年大部分产能已预订——这一供应声明向市场确认了结构性短缺的存在。Micron 的 HBM 市场份额预计在 2025 年底达到约 20–25%。

三星 在热稳定性与堆叠良率方面遭遇持续挑战,12-Hi HBM3e 直到 2025 年 9 月才通过 NVIDIA 认证——比竞争对手晚了超过 18 个月。这一延误使三星错失 H200 及早期 B200 量产周期的高毛利窗口,相应收益集中在 SK Hynix 与 Micron。随着 HBM 路线图向 HBM4 推进,三星需要在每个节点重建认证可信度。

2026 年初,HBM 生产已消耗全球 DRAM 晶圆约 23% 的产能,间接压缩了标准 DRAM 的供给空间。SK Hynix 与 Micron 均表示 2026 年产能已全部预订,超大规模云服务商开始直接锁定内存厂产能——微软在 2026 年 1 月与 SK Hynix 签订 Maia 200 加速器的独家 HBM3e 供应协议即为典型案例。

CoWoS 为何成为 AI 部署的瓶颈

制造 HBM3e 叠层只是第一关。将 HBM 与运算芯片集成,还需要先进封装——台积电的 CoWoS(Chip on Wafer on Substrate)是这一环节的主导技术,也是与 HBM 供应相互独立的第二道瓶颈。

CoWoS 将运算芯片与 HBM 叠层并排放置于硅中介层上,通过细间距微凸块实现有机基板无法达到的互连密度。所有主流 AI 加速器——NVIDIA H100、H200、B100/B200、AMD MI300X——均须经过台积电的 CoWoS 封装工序。目前没有其他晶圆厂能以等量规模提供替代产能。

台积电 CEO 魏哲家在多次法说会中表示,CoWoS 产能"非常紧张,2025 年及 2026 年均已售罄"。具体数字揭示了约束根源:台积电 2024 年底的 CoWoS 月产能约为 3.5 万片,计划在 2025 年底扩至 7.5 万片,2026 年底进一步达到 13 万片——这是不到两年近 4 倍的扩产幅度。但 CoWoS 设备需要专用洁净室基础设施,交期以年计。

NVIDIA Blackwell 架构带来额外复杂性:GB200 芯片面积超过光刻机单次曝光上限(reticle limit),台积电因此推出 CoWoS-L(Local Silicon Interconnect Bridge 变体),通过嵌入式硅桥拼接多颗 chiplet。CoWoS-L 需要额外的工艺步骤与不同设备,使台积电须同时在两种封装流程上分配扩产投资。

对各方参与者的影响

NVIDIA 而言,HBM 供应与 CoWoS 产能的复合制约成为营收兑现的物理节流阀。2024–2025 年 B200 出货低于需求,主要原因是封装产能不足,而非芯片良率问题。

AMD MI300X 而言,同样面临双重依赖——依赖同一个 CoWoS 队列和同一池有限的 HBM3e 供应。AMD 相对较低的出货量为其在分配谈判中提供一定灵活性,但无法绕开上述两道瓶颈。

SK Hynix 与 Micron 而言,作为主要认证供应商的地位赋予了至少到 2026 年的定价能力。已预售状态使谈判筹码从买方转向卖方,允许厂商与超大规模云服务商签订多年期供应协议。

对整体半导体产业而言,CoWoS 瓶颈印证了一个核心判断:先进封装——而非晶体管密度——已成为 AI 算力扩张的主要限制因子。下一代 AI 硬件的封装产能规划,必须在流片前就与晶圆厂锁定,而非事后追赶。

来源

  1. SK Hynix 新闻稿:「全球首款 12 层 HBM3E 量产」— news.skhynix.com — 取用日期 2026-05-20
  2. SK Hynix 新闻稿:「业界首款 HBM3E(8-Hi)量产」— news.skhynix.com — 取用日期 2026-05-20
  3. SK Hynix 新闻稿:「SK AI Summit 2024 发布 16 层 HBM3E」— news.skhynix.com — 取用日期 2026-05-20
  4. TrendForce:「Micron 开始量产 HBM3e 供 NVIDIA H200」— trendforce.com — 取用日期 2026-05-20
  5. TrendForce:「Micron 12-Hi HBM3e 量产就绪,瞄准 NVIDIA H200 / B100/B200」— trendforce.com — 取用日期 2026-05-20
  6. TrendForce:「SK hynix HBM3e 16Hi 引领市场」— trendforce.com — 取用日期 2026-05-20
  7. JEDEC 新闻稿:「JEDEC 发布 HBM3 标准更新」— jedec.org — 取用日期 2026-05-20
  8. Micron 产品页:HBM3E — micron.com — 取用日期 2026-05-20
  9. Tom's Hardware:「HBM 路线图:Micron、Samsung、SK hynix 迈向 HBM4」— tomshardware.com — 取用日期 2026-05-20
  10. Tom's Hardware:「台积电 CoWoS 封装产能因 AI 需求紧张」— tomshardware.com — 取用日期 2026-05-20
  11. FusionWW:「AI 瓶颈内幕:CoWoS、HBM 与 2–3nm 产能约束(至 2027)」— info.fusionww.com — 取用日期 2026-05-20
  12. Siemens EDA 博客:「HBM3e 与 HBM4 IC 设计指南」— blogs.sw.siemens.com — 取用日期 2026-05-20
  13. Wikipedia:「High Bandwidth Memory」— en.wikipedia.org — 取用日期 2026-05-20