AMD挑战英伟达,发布新AI芯片MI325X

思源评车 2024-10-17 13:34:35

芝能智芯出品

AMD 超微半导体 宣布推出了一款新的AI芯片——Instinct MI325X,AMD正式向数据中心市场的领头羊英伟达发起了挑战(下一代Blackwell芯片)。

一直在数据中心领域占据主导地位,尤其是在AI加速技术方面,英伟达的GPU因为强大的计算能力,成为了训练和运行大型AI模型如OpenAI的ChatGPT等的首选。

AMD这次推出的Instinct MI325X被认为是英伟达 Blackwell的直接对手,两家公司将会有一番激烈的市场争夺。

Part 1

AMD的这次发布为什么很重要?

英伟达几乎垄断了数据中心AI芯片市场,占有超过90%的份额。作为市场的第二号选手,AMD一直想要增加自己的市场份额。这次的Instinct MI325X发布,是AMD对英伟达领导地位的一次重大挑战。

性能亮点

● 内存与架构:AMD MI325X 配备了256 GB的HBM3e内存,基于CDNA 3架构。这款GPU拥有16-Hi堆栈的内存,提供6 TB/s的内存带宽,FP8性能达到2.6 PFLOP,FP16性能为1.3 PFLOP,集成1530亿个晶体管。

● 性能对比:据AMD称,MI325X在某些特定的AI工作负载上,性能比英伟达的H100高出30%。特别是在处理大型语言模型(LLM)时,如Mixtral 8x7B、Mistral 7B和Meta Llama 3.1 70B等,MI325X的表现优于英伟达 H200,分别快40%、30%和20%。

预计MI325X将于2024年第四季度开始量产,通过主要合作伙伴在2025年第一季度推出相应的服务器解决方案。

每台AI Instinct服务器最多可配置8个MI325X GPU,总内存容量可达2 TB HBM3e,内存带宽达到48 TB/s,FP8性能高达20.8 PFLOP,FP16性能为10.4 PFLOP。

2025年,AMD计划推出全新的Instinct MI355X GPU加速器,专为AI工作负载设计,采用3nm工艺节点,使用CDNA 4架构。

内存容量将提升至288 GB HBM3e,内存带宽增加50%,达到8 TB/s。与MI325X相比,MI355X的FP16性能将提高80%,达到2.3 PFLOPs;FP8性能也将提高80%,达到4.6 PFLOPs。

此外,MI355X还将支持FP6和FP4数据类型,计算性能分别为9.2 PFLOPs。配备8个MI355X GPU的平台将于2025年下半年上市,提供2.3 TB的HBM3E内存容量、64 TB/s的内存带宽、18.5 PFLOP的FP16计算性能、37 PFLOP的FP8计算性能和74 PFLOP的FP6/FP4计算性能。

AMD推出了最新的ROCm 6.2生态系统,旨在进一步提升Instinct加速器在AI工作负载中的性能。根据AMD的数据,ROCm 6.2在推理任务中的平均性能提升了2.4倍,最高可达2.8倍;在训练任务中,平均性能提升了2.4倍。

Part 2

AMD的后续动作

如果AMD的AI芯片能够被看作是英伟达产品的有效替代品,那么英伟达可能不得不面临降价的压力。

AMD的Instinct MI325X有显著的技术进步。它采用了AMD的CDNA 3架构,配有256GB的HBM3E高带宽内存,可以提供6.0TB/s的传输速度。英伟达的H200芯片在内存容量和带宽上都要逊色一些。

在处理大型语言模型时,AMD的新芯片可能比英伟达的H200表现更好,例如在Meta的Llama 3.1模型上,AMD的推理效率提高了40%。这些性能的提升让AMD在市场上有了更强的竞争力。

英伟达的成功不仅源于其硬件的强大,还有其广泛的软件生态系统,CUDA编程语言是AI开发的标准,很多开发者都倾向于使用英伟达的产品。不过,AMD正在通过改进其ROCm软件,努力减少开发者转向AMD平台的障碍。

AMD的目标很明确:提供能与英伟达匹敌的硬件,加上灵活的软件支持,吸引那些不希望被单一供应商绑定的开发者。

英伟达不是毫无准备,计划在2024年初大规模生产Blackwell芯片,推出新一代AI加速产品,以保护其市场份额。

同时,英伟达在AI芯片领域建立了深厚的技术标准基础,许多AI开发者已经习惯了使用英伟达的CUDA生态,这对英伟达来说是一个巨大的优势。

AMD的加入无疑增加了英伟达的市场压力。随着更多公司进入AI芯片市场,可能会引发价格战,从而影响英伟达的盈利空间。尽管英伟达的股票在2024年已经上涨了超过175%,但AMD的行动显示,未来的市场竞争将更加激烈。

为了赢得这场竞争,AMD已经规划好了接下来的发展路径。

● Instinct MI325X只是第一步,AMD计划在未来几年推出性能更强大的AI芯片系列。例如,2025年的MI350芯片将进一步提高推理和训练效率,而2026年的MI400系列则有望实现更多技术革新。

● 除了AI加速器外,AMD还在数据中心CPU市场加大了攻势。新一代的EPYC处理器帮助AMD获得了更多的服务器市场份额。这些CPU与AI加速器相结合,构建了一个强大的计算平台,使AMD能够满足各种AI计算需求。

AMD和英伟达之间的竞争不仅是一场技术竞赛,也是一场市场策略和生态系统的较量。

随着AI需求的快速增长,数据中心市场变得越来越重要。尽管英伟达目前领先,但AMD正通过不断的技术创新和软件平台的改进,逐渐缩小差距。

未来的市场将更加多样化,而开发者和云服务提供商的选择,将决定这场AI芯片战争的结果。

小结

对于用户和企业而言,这场竞争最终会带来更好的性能、更多的选择和可能更低的价格,同时也将加速AI技术的普及。AMD与英伟达之间的这场较量,能带来更多的选择。

0 阅读:0