7月24日,据路透社报道,三星电子第四代高带宽内存(HBM3)芯片通过了英伟达处理器的质量测试,三位知情人士表示,这也是该技术将首次用于英伟达处理器。
消息人士称,三星的HBM3 芯片将只用于一款不太复杂的英伟达图形处理器(GPU)H20,这款产品是根据美国出口管制规定为中国市场开发的。目前尚不清楚英伟达是否会在其其他 AI 处理器中使用三星的 HBM3 芯片。他们补充说,三星第五代 HBM3E 芯片也尚未达到英伟达的标准,这些芯片的测试仍在继续。
7月22日,首尔经济日报也报道称,业内人士透露,三星电子最近通过了英伟达的HBM3资格测试,三星华城17号产线已经量产,并向英伟达供应HBM3内存。此外,为弥补HBM供应造成的通用DRAM内存供应短缺,平泽P4工厂转为DRAM专用生产线。
5月消息称,自去年以来,三星一直在努力通过英伟达对HBM3和HBM3E的测试,但由于发热和功耗问题而举步维艰,一直未能通过英伟达测试。
不过随后三星电子发布声明否认了相关报道,该公司声称他们正在与多家全球合作伙伴“顺利进行HBM 芯片测试过程”,同时强调“他们正与其他商业伙伴持续合作,以确保产品质量和可靠性”。
HBM(High Bandwidth Memory,高带宽存储器)是一种高性能的3D堆叠式DRAM内存技术。它通过使用先进的封装方法,如TSV(Through-Silicon Via,硅通孔技术)来垂直堆叠多个DRAM芯片,从而实现高容量、高带宽、低延时和低功耗的特点。HBM 是人工智能 GPU 的关键组件,有助于处理复杂应用程序产生的大量数据。
目前HBM主要制造商只有三家,SK海力士 、美光和三星。2013年,SK海力士与AMD合作开发了世界上的第一个HBM,此后SK海力士长期深耕并在此领域保持领先地位。据悉,继HBM3之后,SK海力士已经领先一步,开始为英伟达量产第5代HBM3E。美光方面HBM3E在今年初也已通过英伟达的验证,并获得了订单。
但由于HBM供不应求,英伟达也渴望看到三星能加快通过认证,以便能够实现供应商基础多元化。据两位消息人士称,三星最早可能在 8 月份开始为英伟达的 H20 处理器供应 HBM3。
英伟达方面,去年10月17⽇,美国再次收紧了出口限制,导致英伟达针对2022年限制推出的中国特供版A800和H800芯片,以及一款顶级游戏显卡RTX 4090被禁。为了满足中国大陆的需求,英伟达再次着手为中国市场定制三款芯片,HGX H20、L20 PCle和L2 PCle,并计划在今年二季度量产。
其中HGX H20是最先进的一款,主要用于 AI 模型训练。但根据美国的限制,H20的计算能力与在非中国市场销售的版本H100相比算力大幅降低。
H20内存容量96 GB,运行速度高达4.0 Tb/s,运算能力为296 TFLOPs,使用GH100芯片,性能密度仅为2.9。H100拥有80GB HBM3內存,內存频宽3.4Tb/s,运算能力高达1979 TFLOP,性能密度高达19.4。也就是说,英伟达的H20芯片的AI算力只有H100的不到15%。该芯片部分性能还不及国产Ascend 910B,显然,这样性能并不能满足中国厂商AI训练的需求。
这也导致H20一度表现不佳。自去年11月以来,中国互联网大厂就开始测试英伟达“中国特供版”AI芯片样品,但结果却不理想。由于算力不足,相关公司彼时还暗示英伟达,今年订购的英伟达芯片数量将远少于原计划。根据路透社的调查显示,在过去六个月中,只有五个买家或附属买家表示有兴趣购买H20芯片,而同期Ascend 910B芯片的购买者则达到十几个。
在今年一季度电话会上英伟达也表示,尽管其在中国市场推出了“特供版”的芯片,但来自中国市场的销售额依然较之前“大幅”下滑。管理层还预计,中国市场未来将有非常激烈的竞争。2023财年英伟达对中国的销售占数据中心业务收入的19%,这一比例在2024财年降至了14%。
为了提升的竞争力,随后有消息称,英伟达对H20进行了降价,再加上需求旺盛,国产供应不足。摩根士丹利的最新报告称,英伟达特供中国市场的人工智能芯片H20系列,已经重新开始吸引了包括百度、阿里巴巴、腾讯和字节跳动在内的中国科技巨头的采购兴趣。
7月22日,路透社最新报道称,英伟达目前正在为中国市场开发又一款新旗舰 AI 芯片,这款暂定名为“B20”的芯片。“B20”计划于 2025 年第二季度开始出货。该芯片是英伟达于 3 月推出的“Blackwell”芯片系列,将于今年晚些时候量产。
在该系列中,B200在某些任务(如提供聊天机器人的答案)上的速度比其前代产品快30倍,根据命名来看B20或是B200的替代。当然,此次这款定制芯片效果如何,还需上市后见分晓,性能以及价格方面,依旧是中国买家考虑的重点。