英伟达BlackwellAI芯片有设计缺陷,延后3个月出货,影响微软谷歌

科技测评老皮 2024-08-14 03:27:05

继英特尔之后,英伟达也摊上大事了。

本周令人难忘,8月2日周五美股全线大跌,芯片巨头英特尔因为业绩爆雷,股价大跌30%,市值暴跌至900亿美元,远低于竞争对手AMD的2100亿美元。与此同时,ARM公司的股价最近日也在暴跌,英伟达在周五的时候股价跌至103美元,创下近日新低。

半导体行业从一路高歌逐渐走向平缓。然而真正的风险可能还在后面。受AI热潮而大涨的英伟达今年意气风发,市值一度超越苹果,创下历史新高,达到全球第二大的规模。英伟达即将在8月28日公布最新一季的财报,正当大家最近准备抄底时,本周六(8月3日)突然又爆出一个英伟达的超级大新闻。

8月3日,据科技网站The Information报道,由于设计缺陷,英伟达下一代Blackwell架构的AI旗舰芯片GB200将延期出货,出货时间将推迟三个月或者更长,本次受影响的公司包括微软、谷歌和Meta。这三家公司都在最近的财报电话会议中表示将继续加大资本开支,投入AI领域,也就是购买英伟达的AI芯片用于AI训练。

据《The Information》报道,微软、谷歌和Meta这些巨头企业已经向英伟达集体订购了数百亿美元的芯片。这篇报道援引了两位帮助生产Blackwell架构的AI旗舰芯片及其服务器硬件的身份不明人士的话。《The Information》的报道可信度应该较高,彭博社等一众网站也援引了该报道。

据《The Information》报道,据一位不愿透露姓名的微软员工和另一位人士称,英伟达本周通知微软,Blackwell系列中最先进的AI芯片型号将受到延迟影响。The Information补充说,这些延迟意味着预计要到2025年第一季度才会有大批量出货。

报道称,英伟达的一位发言人不愿就其向客户发表的有关延迟的声明发表评论,但英伟达一位发言人表示:"生产正按计划在今年晚些时候进行"。

在今年3月份的GTC 2024大会上,英伟达正式发布全新一代Blackwell GPU架构。英伟达近年来保持着每两年发布一次全新架构的节奏,从2020年的Ampere架构到2022年的Hopper架构,再到2024年的Blackwell架构,每一次架构的更新都为AI应用带来了革命性的提升。

作为最新发布的架构,基于Blackwell架构的GPU具有2080亿个晶体管,采用专门定制的台积电4NP工艺制造,所有Blackwell产品均采用双倍光刻极限尺寸的裸片,通过10TB/s的片间互联技术连接成一块统一的GPU。基于该架构的芯片款式有3类——B100、B200、GB200超级芯片。

目前来看,Blackwell是地表最强的GPU架构,为AI应用带来了革命性的提升,它能够使企业在万亿参数大型语言模型上构建和运行实时生成式AI,其成本和能耗较上一代产品最低可降至1/25。

Blackwell GPU内置第二代Transformer引擎,利用先进的动态范围管理算法和细粒度缩放技术(微型tensor缩放)来优化性能和精度,并首度支持FP4新格式,使得FP4 Tensor核性能、HBM模型规模和带宽都实现翻倍。

基于Blackwell架构的GB200芯片包含两个相连的Blackwell GPU和一个Grace中央处理单元。据外媒报道,最近几周,台积电工程师为量产进行准备时却在连接两个Blackwell GPU的裸晶上发现了设计缺陷。

这一缺陷会导致芯片良率或产量降低。应对这种情况的通常做法是停止量产。因此英伟达不得不对芯片设计进行调整,并在开始量产前与台积电合作进行新的试生产。

据悉,台积电原本计划在今年第三季度开始量产Blackwell系列芯片,并从第四季度开始向英伟达客户批量发货。然而,由于设计缺陷,量产时间可能推迟到今年第四季度,批量出货的时间预计要推迟到2025年第一季度。

如果这个问题得不到解决,英伟达将遭遇麻烦,至少在股价上或许还会继续下跌。而更雪上加霜的是,最近美国司法部正准备对英伟达进行反垄断调查。因为英伟达现在占据大约80%的AI芯片市场份额,英伟达在出售AI芯片时可能滥用其市场支配地位。

叠加最近整个半导体行业股价大跌、美联储即将降息,以及英特尔、ARM、亚马逊、谷歌、微软等科技巨头的暴跌,市场似乎为英伟达留下了一个深渊。

0 阅读:0