国产AI服务器性能再创业界新高。3月17日,联想发布重磅消息:联想问天WA7785a G3服务器在单机部署满血版DeepSeek大模型时,极限吞吐量高达6708 token/s,意味着联想服务器运行大模型的性能再一次创下业界新高。#联想一横五纵# 在此之前,联想的另一款服务器问天WA7780 G3已经表现得非常强大,单机部署满血版DeepSeek大模型总吞吐量能突破2500 token/s。不过,现在的联想问天WA7785a G3直接把性能拉高了一大截,让单台服务器就能支撑起1500人规模企业的正常使用。#联想全栈AI# 其实,联想问天WA7785a G3是由联想和AMD联合设计的服务器。在算力引擎方面,联想问天WA7785a G3搭载了2颗AMD处理器和8颗AMD新一代Instinct OAM GPU。这些硬件组合在一起,让这款服务器有足够的“脑力”来处理大模型训练、推理等场景任务。此外,联想问天WA7785a G3的显存容量特别大,单颗GPU的HBM3e显存容量高达192GB,总计达1.5TB。超大显存使得单机支持全量模型推理情况下,也有足够的空间来存储临时数据,不会因为数据太多而卡顿。#联想一擎三箭# 【创新高!联想AMD AI服务器极限吞吐量达6708token/s】关注拿惊喜!按照图示关注“联想中国”抖音号,20元红包有机会收入囊中,快在3月31日前试试吧。抽奖详情
国产AI服务器性能再创业界新高。3月17日,联想发布重磅消息:联想问天WA778
放点糖呗
2025-03-17 20:09:21
0
阅读:0