迟来的“X3D”:来自AMD锐龙79800X3D的降维打击

科技有点奇谱 2024-12-12 16:26:40

AMD和Intel之间的较量,是要出阶段性结果的时候了!面对Intel的自乱阵脚,调整思路后的AMD再下一城,坚定选取“锐龙7”产品线下的锐龙7 9800X3D作为Zen5架构的首款X3D产品,这样的思路可以说一脉相传,延续了锐龙7 7800X3D“游戏神U”的整体思路,让这个台式机游戏处理器之王宝座继续坐稳。

在“堆”Cache这一路径爆发之前,堆核心/线程数量与提升频率,是唯二的两条对处理器性能提升有立竿见影效果的路径。在个人电脑产品端,锐龙倾向于前者,16核乃至32核产品早已登上桌面;酷睿选择后者,将频率推升到6GHz级别。

然而,这唯二路径都将或已经遇到技术瓶颈,问题的核心都是难以逾越的功耗。眼见狂飙频率的边际效益越来越低,而功耗快速提升、散热的代价越来越大,英特尔拿出了P+E核心架构的解决方案,用E核增加核心而用P核飙频率。

而Zen架构面世以来,AMD推着x86架构处理器核心数量一路提升,但个人应用对线程的需求总是相对有限的,这就逼着AMD做出新的选择。

两年多前,锐龙7 5800X3D携100MB级别的L3 Cache而来,打开了性能,特别是游戏性能提升的新思路。看似简单地增加一块独立的64MB 3D V-Cache的方式,甚至连处理器的逻辑架构都没有改变,这就意味着,包括游戏在内的软件,对X3D处理器无需优化,即插即用。

当然,如果应用程序能够针对高一个数量级的L3 Cache进行数据调度层级的优化,减少从内存调用数据的次数、增加单次调用数据的规模——提升X3D处理器的缓存利用率,缓存较内存低一个数量级的延迟的优势,将得到充分发挥。针对大容量缓存的软件层级优化,已经在企业级软件上展开,而个人端,游戏则是那个天生就贪更多缓存的应用类型,因此游戏能够从X3D架构上获得更高收益。

和两年半前初次上市的锐龙5000X3D相比,此次锐龙7 9800X3D上市的热度更高,至今一直处于预定状态。两年半前,5800X3D以449美元/3099元的价格上市,而9800X3D更热门,479美元/3699元的价格被炒至翻番水平。虽然它可使用600系列和800系列芯片组的主板平台,但X870E显然是更好的选择。

技嘉超级雕X870E AORUS MASTER有着和锐龙7 9800X3D相近的价格水平,是与锐龙7 9800X3D门当户对的选择。这既包括主板提供对处理器的Ryzen Master、PBO、EXPO等超频技术、超强供电等特性,还包括这集级别平台“该”具备的扩展能力——4个M.2 22110(其中3个为PCI-E 5.0 x4)和3条PCI-E 5.0 x16(物理)。

有意思的是,随着处理器支持USB Type-C DisplayPort备用模式,技嘉超级雕X870E AORUS MASTER主板也不再提供标准DP接口,转而提供了两个USB 4.0接口——均带有DP输出功能。用9800X3D的2CU的Radeon集显,包括集成的HDMI接口在内,主板将提供3个显示输出接口;插上独显,两个USB-C接口同样具有USB by DP显示输出功能,提供比但独显更强的显示器连接能力。

9800X3D支持DDR5-5600内存频率——双模块,而4内存模块配置下,支持频率跌至DDR5-3600。我们测试所使用的是芝奇Trident Z5 Neo 焰锋戟RGB DDR5 6000 CL28 16GB×2内存套装,超过DDR5-5600MT/s的需求,同时最高时序可达CL28-36-36-96的高水平。

只是不要忘了,近年来,AMD一直在增强内存支持能力,EXPO内存超频技术日臻完善,9800X3D+X870E平台甚至可将内存频率提升到8000MT/s。

实际测试中,这套内存不仅能够以EXPO模式稳定工作在6000MT/s水平,更可通过降低时序至CL42-40-40-77水平,是运行频率提升至7200MT/s,带宽较EXPO模式增加10%。

可大幅超频的内存,在很大程度上缓解了4内存模块配置时,带宽损失的问题,从而实现了带宽与容量,甚至还有价格的多赢,192GB内存的PC系统不是梦。

显卡方面,测试平台采用了技嘉魔鹰RTX4090 OC 24GB(2520MHz),以最大化发挥处理器性能。除此之外,SSD采用了英睿达T705 Pro 2TB PCI-E 5.0 x4;操作系统为Windows 11 24H2,显卡驱动版本为566.14,主板BIOS版本为F4g。

截止至发稿时,技嘉超级雕X870E AORUS MASTER的最新BIOS版本为F4g,其内嵌的AGESA版本为1.2.0.2a,已经针对锐龙9000X3D进行了性能优化,特别增加了X3D Turbo Mode,也就是业界盛传的“游戏性能增加35%”的黑科技。

这一功能发挥作用,不仅要求安装系统时已安装X3D处理器,而且要在BIOS中开启X3D Turbo Mode、Window中安装AORUS AI SNATCH软件,操作还是有一定复杂度的。

这一技术真的有技嘉宣传的那么神吗?我们的测试启用了它,用最终结果验证一下吧!

对比测试平台配置了酷睿i9-14900K+技嘉Z790 AORUS MASTER X 1.0,驱动版本相同。相比9800X3D,14900K是英特尔已经上市1年了的产品。由于运行频率高,它仍保持着酷睿家族中游戏性能王者的地位——除了酷睿i9-14900KS这一特别版。推出早,再加上蓝屏事件,如今14900K特别是无核显的14900KF的价格,更加趋近于9900X。

既然是游戏神U,那就先从游戏开始。这是锐龙7 9800X3D的独美时间。

3DMark系列的基准测试中,随着画面分辨率的下降,9800X3D的性能优势逐渐放大出来。要知道,3DMark的测试主要围绕GPU性能完成,CPU的影响主要呈现在极限帧率情况下——GPU瓶颈影响不显著。

在更多的实际游戏运行测试中,9800X3D的优势更为明显——处理器指令系统及运行频率对游戏性能的影响边际效益显著缩小,而大容量缓存在频繁吞吐数据较大数据场景,性能较内存有着指数级的优势。只要吞吐数据规模合适,也就是突破非X3D、直接L3 Cache容量的约30MB水平,而达到90MB级别,3D V-Cache的加速非常明显。很幸运的是,从寻求高帧率的网游及fps游戏,到突出画面沉浸体验感的3A大作,都能满足这一条件。

以相同的1920×1080(Full HD)分辨率、超高画质、开启光追,并尽可能均开启DLSS的画面参数,高性能的显卡均能获得一流的流畅运行体验。而CPU在背后,为游戏的出色运行提供了基础保障。想对于日益流行的2K乃至4K画质,Full HD分辨率、超高画质,既非CPU limit也非GPU limit,能够使两者的性能更平衡地发挥出来。

从实际测试结果可见,9800X3D在特定游戏中可获得超过40%的帧率领先优势,越趋于CPU与GPU性能均衡(当前画质),3D V-Cache所带来的性能加持越明显。更直白一些就是CPU limit上限大幅度提高,系统性能的瓶颈,更偏向于GPU了。

反之,无论是《坦克世界》这样500fps+速度的网络游戏,还是全新热门3A大作《黑神话:悟空》,它们都会触及CPU limit或GPU limit红线,因此9800X3D和14900K的游戏帧率差异很小,后者以频率优势在CPU limit情况下获得小幅度的领先优势。

如降低画质至1280×720(HD)、最高速度/最低画质,GPU负载大幅度降低,测试帧率更多地反映CPU性能对游戏的影响。这组数据十分有趣,在上一组测试中,9800X3D在《Dota2》和《古墓丽影》上有高达40%帧率优势,此时减小到20%量级;而两颗处理器在《孤岛惊魂5》和《孤岛惊魂6》的差距扩大到30%以上的幅度,此前的差异仅为11.3%和-0.5%。

每秒帧数的增加,无形中加大了游戏数据吞吐规模,使9800X3D的大容量Cache的高带宽、低延迟的优势得以进一步发挥。

与之相反的是,当画质提升到3840×2160(4K)、超高画质后,GPU负载大幅度提升,CPU对游戏帧率的影响,回到了Full HD、超高画质时的近似水平。难道9800X3D有什么特异功能?竟然让同款GPU发挥有如此大的差别。

经过以上三组数据的比对,特别是两组超高画质下的性能差异接近,进一步反应出处理器架构层面的差异。的确,《Dota2》和《古墓丽影:暗影》一直以来都是锐龙处理器的优势项目,但是9800X3D能够让这一优势在不同分辨率下均保持如此之幅度,仍出乎我们的预料。

9800X3D现有的夸张的游戏性能表现,有无主板X3D Turbo Mode的贡献,分辨已无意义。相信除了已经推出类似技术优化的技嘉和微星,其他品牌也将很快跟进。锐龙9000X3D处理器将一直这么夸张下去。

在游戏之外,9800X3D同样是一颗攻守兼备的全功能型处理器,而且功耗水平更低,日常使用同样出色。上表的Cinebench R23性能成绩仅作参考,毕竟8核/16线程与更高频率的24核/32线程相比,规格上亏太多。要在这方面拉平,价格与之同级别的9900X出手更为合适,毕竟9800X3D多的3D V-Cache在此项测试中发挥有限。

这组数据更重要的作用是看功耗。两款处理器有着相接近的TDP,但是实际工作起来,9800X3D较14900K要清凉不少——BIOS设定限制。而功耗方面,9800X3D远低于对比产品,而比前代产品更高的运行频率以及超频幅度,则与第二代3D V-Cache设计改进有关。

由于Cinebench系列测试无海量数据吞吐需求,作为发热量大户的3D V-Cache处于闲置状态,再加上其位置从此前的CCD之上改进为CCD之下,对CPU核心散热的不利影响被完全消除,因此只需要自动设置PBO就能获得3%的频率及性能提升,而其功耗增加幅度几乎与对手提升1%的性能相同。

相对于没有3D V-Cache的锐龙9000X系列产品,虽然9800X3D的基频标定高达4.7GHz,但是加速频率标定非常保守,频率加速幅度仅有500MHz——其他几款产品幅度达到1.2GHz~1.7GHz。依托更高的基频,9800X3D在没有大缓存特性加持的重负载应用中,仍有相当出色的性能表现。假以时日,以3D建模、辅助设计、数据分析和音视频渲染为代表的此类应用再完善大缓存吞吐机制,摆脱内存频繁吞吐的掣肘,性能增益将更加显著。

在负载时间短或线程需求少的办公应用场景中,核心数量和频率都不占便宜,特别是加速频率低情况下,9800X3D表现逊色于14900K一点也不意外。毕竟,术业有专攻,9800X3D 拉开架子猛提游戏性能,拿它办公有点杀鸡用牛刀了。

从轻负载时的小幅落后、基准测试时的平齐,到各类游戏中的大杀四方,锐龙7 9800X3D的游戏优势属性日益明显。对玩家来说,昂贵入RTX 4090的显卡固然能够带来动辄超过200fps的游戏帧率,但是依靠CPU的架构创新,同样能使游戏体验更佳,它何尝不是更具性价比的选择呢!

何况,随着3D V-Cache架构产品的普及,包括办公和多媒体处理,以及游戏的广泛优化,不靠提升频率或增加核心数量,锐龙9000X3D们的适用及优势场景将更加多样。

0 阅读:0