帧数暴涨4倍!不降画质,不挑显卡,还适用所有游戏?【宝藏贴】

科技聊聊也挺好 2024-03-15 00:34:30

我有几个免费的软件,能让你手里一切和显卡、图形计算相关的设备,性能翻2倍、甚至4倍,你信不信?

2周前,如果你问我这个问题,我宁愿信自己的老板是秦始皇,但现在已经是两周后了,没错,真的有这样的软件,她免费、开源、性感,不计较你的过去有多复杂,温柔地兼容着世界上的每张显卡,不介意卡卡们的灵魂究竟属于AMD还是英伟达。

那么问题来了?这么牛逼的软件是怎么做到的?要去哪里下载?该怎么使用?有没有风险?BlaBla……我们一个个来解释。

一切的一切都要先从游戏开发说起,总所周知比较吃性能的游戏,大多都是3D游戏,而3D游戏在开发的时候无论是建筑、角色、植物、动物……在时间和成本允许的情况下,都会尽可能在游戏的世界里做出来一个真实存在的3D模型,这样玩家在游玩的过程中观感会更加直观、立体、真实。

那么问题来了,绝大多数玩家玩游戏都是通过2D平面显示器进行的,那如何把3D的模型呈现到2D的显示器上呢?

答案是:量子力学

啊开个玩笑,答案恰恰相反没那么复杂,而是简单粗暴的——拍照

没错,就硬找个“相机”去根据玩家操作的角度,拍相应角度的画面,然后拍完了发给显示器。这个所谓的“相机”其实就是你的显卡,这整个过程在计算机图形学里就叫做“光栅化”。

具体来说显卡在“拍照”的时候,会根据你对游戏画质的设置,用不同的姿势去“拍”,其中用来表达画面清晰度的东西,叫做“分辨率”。

在显示器支持的情况下,显卡输出的画面分辨率越高,你视觉体验上画面就越细腻、边缘的锯齿感就越不明显,然后再通过阴影、光效、抗锯齿等功能来进一步修饰画面效果,但其中最耗费显卡性能的依然是分辨率,所以你可以简单粗暴的说,分辨率决定了你80%的体感画质。

但相应的,分辨率越高,光栅化的过程难度就越大,对显卡的性能要求就越高。

总所周知,老黄家有个名为DLSS的黑科技,到现在已经发展到第三代了。而想要搞清楚开篇提到的那几个软件运作原理,就一定要先搞懂DLSS(深度学习超级采样技术)。

第一代DLSS用一个字就可以概括——那就是:“猜”

举个例子,你在开了DLSS 1.0之后,再启用4K分辨率,显卡其实偷懒了只跑了1080P分辨率,然后压榨显卡上的AI运算核心,让AI根据1080分辨率的画面和之前喂给他的数据库,去强行“猜”出来完整的4K画面长什么样子

猜?这TMD听上去是不是有点不靠谱?但实际上……

实际上也很不靠谱。。

初代DLSS从运作原理上就决定了,如果你想要有比较好的体验,就需要根据你具体在玩的这个游戏类型,给它喂相似画风、相似人物、相似视角……一大堆有相似特点的素材,它才能猜出个像样的结果。

显然,这么繁琐的工作你不能让消费者自己动手做吧?所以只能靠游戏开发商自己调教AI,但这就是最TM操蛋的地方了,对于游戏开发商来说,调教AI的商业回报吸引力实在是太差了,画面优化什么的勉强够用,别整出来什么大乱子就行了,相比之下,修BUG、反作弊、补DLC、做坑钱活动……哪一样不比调教AI更重要呢?

(*妈的好像反作弊更不重要@所有FPS游戏)

所以初代DLSS在各家游戏的实际表现非常参差不齐、非常毁誉参半,甚至有的游戏开了还不如不开。久而久之英伟达只能痛腚思痛,他们重新构思,有没有可能做出来一种,不需要让游戏开发商单独训练的AI,同时又能让AI在“猜”画面的时候,更加准确呢?

于是DLSS 2.0出现了

和上一代相比,不变的是第二代的DLSS在整体的设计思路上,依旧是为显卡的性能开源节流。但不同的是,DLSS2.0不再依靠单一的低分辨率画面素材为依据,而是会在运行的时候把目标分辨率画面,拆成多个次级分辨率像素点。比如一张单帧4K的画面,理论总渲染工作量是4倍1080P,这时DLSS 2.0会给你拆成N个1080P的像素点,然后在实际运算的时候显卡还是渲染1080P画面的工作量,最后在AI的辅助下决定用哪些像素点,再给你按照4K的要求合成这个画面。

图源:@硬件茶谈

更牛逼的是,他们真的搞出来了一个,不需要单独训练,就可以为所有类型游戏优化画面的超级AI,同时这个AI在运算的时候,会参考前几秒已经运算好的帧画面,补全当前这个需要猜的画面应该是什么样子。所以整体来说AI“猜”的依据更充分了,要“猜”的范围变小了,最后的结果就是AI“猜”的更精确了。

这也是为什么有不少游戏开了DLSS 2.0之后的画质,比TM直接输出的原画质,看起来还要更好。。。因为开了DLSS之后,你看到的并不是开发商的美术设计师给你设计的画面,而是【美术设计师+AI】给你制作的画面,AI会在设计师已完成的工作基础上,填充大量的像素级细节,使得最终你看到的效果,总信息量是超过直接渲染4K的信息量的,所以体感画质会更好。

这还没完!因为接下来的DLSS 3.0更是畜生,这一代又额外增加了“帧生成”技术,以2077为例,按照英伟达官方的说法,理想情况下画质不变,帧数可以足足翻4倍。。。然后我手动去搜了一堆外网大佬测评,大多居然也能有2~3倍的涨幅,恐怖如斯。

至于它的工作原理就非常容易理解了,比如显卡每生成10帧,AI就会根据已有的画面辅助生成3帧,这3帧是彻底不需要显卡计算单元工作的,所以显卡获得了额外的性能释放空间,但相应的代价是AI一定要先等显卡输出素材之后才能开始计算,所以会有额外的物理延迟,不过根据网友们的测试,大多数游戏都可以控制在10ms以内,所以问题不大。真正的问题是为了卖卡,老黄这个B甚至连自家用户都要锁,DLSS 3.0技术只有英伟达40系显卡才能用。

总的来说,以DLSS为代表的AI图形计算优化技术,确实成功实现了用更少的成本(性能),获得了更高的收益(画质),并且随着DLSS的更新迭代,越来越多的开发商开始重视这个技术,目前已经有50多款游戏支持DLSS 3.0了,支持DLSS 2.0的游戏更多,一共有500多款……

但细心的朋友应该注意到了,前文简述了整个DLSS技术的运转原理,其关键的一环,就是要用到“AI运算核心”,这个核心指的是硬件层面的核心,英伟达官方称其为Tensor core,这是只有RTX系列显卡才有的东西。

所以有没有一种新的AI算法,既可以达到类似DLSS的效果,又不需要专门的Tensor core呢?

此时一位25岁就麻省理工博士毕业,上任鹅城不到10年就让AMD股价涨了50多倍的靓女耸了耸肩:

“AMD要有光”

于是AMD就有了自己的AI图形计算技术——FSR

截止到本文发布,FSR同样也已经迭代了3个版本,为了方便理解,粗暴的说FSR的迭代路径和DLSS差不多,1代2代都是通过渲染低分辨率画面,然后让AI脑补高分辨率画面,3代也是帧生成技术,并且经过网友们的测试,效果也相当不错。

图源:90后科技说

但不同的是,FSR不锁特定型号的显卡,不光A卡全系可用,甚至N卡、英特尔,以及未来的任何品牌显卡都能用,因为——他开源了。

但开源不等于无敌,即便是开源,也是需要跟游戏开发商一家家谈判,说服对方支持FSR才行,所以或许是苏妈给FSR项目的经费有限,也或许是商务洽谈进度太慢。FSR 3.0至今仅有4款游戏支持。

总结一下,目前AI图形计算技术的局面非常蛋疼,DLSS 3.0虽然游戏兼容性最好,但因为只允许40系N卡用,所以太封闭。FSR 3.0虽然足够开放,但有没几个游戏支持,所以有力气没地方使。。

但是!不用担心~,因为这种问题既然我们普通玩家都能想到,那开源社区的大爹们也一定会想到……

一位名为@Nukem9的开发大佬,就做了一个可以把DLSS 3.0替换成FSR 3.0的插件,粗暴来说就是集成了DLSS 3.0兼容性好的优势,和FSR不挑设备的优势。

也就是说所有RTX 20、30系的N卡用户,现在可以在所有支持DLSS 3.0的游戏里,体验到FSR 3.0的帧生成技术了,并且有外网大佬一口气测了11款游戏,在画质没有明显下降的情况下,帧率平均上涨了50%~100%,可以说是非常出色了!

这个插件(mod)的名字叫做“dlssg-to-fsr3”,不用急着找下载链接和教程,放心我已经帮大家打包好了,咱们先看完其他的宝藏软件,看完了你再慢慢挑。

我们继续说,上面这个插件只适用20&30系的N卡用户,那对于A卡用户和10系及以下规格的N卡用户们来说,有没有什么好用的插件,也能提升点自己的体验呢?

此时另一位名为@LukeFZ的大佬,搞出了一个名为“FSR2FSR3”的插件,他的思路和楼上那个大爹一样,但是他同时把DLSS 2.0和DLSS 3.0都替换成了FSR 2.0和FSR 3.0,这样DLSS支持库里的游戏们瞬间全都支持FSR了,精A狂喜了属于是。

而且更重要的是,得益于FSR不挑设备的优势,理论上来说只要是支持DLSS的游戏,不管他在什么种类的设备上运行,你都可以通过这个补丁享受到帧率暴涨的快感,比如ROG掌机、联想Legion Go……如果你会反编译MOD、或者愿意刷win系统,甚至连SteamDeck和switch都能瞬间性能翻倍。

说到这里,这个故事已经堪称爽文了,暴涨的帧率甚至已经让我感觉有点麻木了,以前折腾半天超频+挑硬件体质可能帧率也就涨个5%、10%,这动动手指打个补丁就50%甚至翻倍的涨,实在是爽!。

不过,对于性能已经够用,打了补丁动不动就飙升到200多帧、甚至300帧的玩家们来说,其实帧数上涨的收益已经不重要了,所以反过来思考,有没有哪些可以借助AI算法,去提升画质的插件呢?

那你需要的可能是@emoose大佬开发的“DLSSTweaks”,简单说就是这个MOD可以在所有支持DLSS的游戏里,使用一项名为DLAA的抗锯齿优化技术,同时支持手动控制采样系数,平衡帧数和抗锯齿效果,并且同样经过了外网一众大佬测试,抗锯齿效果非常棒,比传统的FXAA、SMAA、TAA都要好。

好了介绍完了这几个MOD,无论你是想保帧率还是想涨画质,相信可以满足绝大多数人的需求了,但由于打MOD这种行为本身会涉及到对游戏根目录和源文件的修改,所以如果你想玩的游戏带有PVP玩法,你需要自己去评估有没有被误判作弊的风险,这一点非常重要!

但!如果……如果再贪婪一点,有没有一种不太容易被封号的帧率优化工具呢?

还真有!比如“THS”大佬开发的Lossless Scaling,除了同样运用了FSR技术,其最大的优势就是作者自称软件使用的API(编程接口)和著名直播软件OBS同款,所以只要是用OBS不会导致封号的游戏,你用这个软件也不会导致封号。并且又因为用的是FSR技术,这个软件不需要游戏本身支持DLSS也能使用,所以说理论上是适配所有游戏的。并且这个大佬也表示自己在研究移植FSR 3.0技术,到时候也会免费更新。

比较巧的是我刚好发现这个大佬开通了steam购买渠道,我是逐个翻了几十条评价,没有看到有一个说自己被封过号的,反倒是有不少网友分享实测XX游戏不会封号,所以安全性还是可以的。

但用相应的要付出的代价是,根据网友们的反馈,这个软件整体来说画质损失是比上面介绍的几个MOD要略高的,原因暂时不清楚,所以如果上面那几个MOD可以解决你的需求,尽量就用上面的。

最后,如文章开头所说,我已经把本文介绍过的所有软件都整理好了,大家可以参考着这张图去选择用哪个软件↓↓↓↓

文末聊聊个人理解,如果说不论是A家还是N家,他们之所以在技术路线、开源or 不开源这些战略问题上会有分歧,其本质原因还是考虑到各自的商业利益。那有这么一群人,他们看起来就纯纯是“犯傻”了。那些开源的大佬们,他们原本可以借此爆点金币,或者自娱自乐开发完了就给自己玩,总之你没办法从商业利益的角度思考,他们究竟是为什么要劳神费力发到社区开源,乃至持续为网友们免费更新。

我能想到的答案只有一个,他们是真的打心眼里觉得,帮助别人很快乐才会这样做。这就是我从开源主义的精神内核里看到的人性光辉,这也是互联网时代所独有的黄金精神。尤其是在这两年全球经济通缩,但AI技术却迅猛发展的背景下,总会让我不由自主的“赛博焦虑”,比如人类的科技树万一点歪了怎么办,万一某天真的有个邪恶的AI奴役全人类、或者被一小部分人私有化垄断怎么办?

但就是这些横空出世的、毫不起眼的开源MOD让我突然没有这么焦虑了。就拿@Nukem9大佬的“dlssg-to-fsr3”MOD为例,可以说是拿着死对头AMD的剑,艹翻了英伟达精心设计的DLSS 3.0封锁,狠狠地骑脸输出NTR了一把。但是MOD从0.1版本发布到现在快1个月了,英伟达愣是一个屁都不敢放,而且我猜用不了多久DLSS 3.0就会开放给全系N卡用户,甚至可能也会部分开源,至于为什么我这么说,那得先捋清楚DLSS 3.0锁旧版显卡这件事儿,对于英伟达来说有多么重要……

大名鼎鼎的“摩尔定律”

我先说个“暴论”——芯片制造行业的发展瓶颈,已经可以用肉眼看到了。这个瓶颈不是投资不足,也不是政治风险,而是基础物理学。因为人类已经在芯片制造这件事儿上,快把物理空间利用到极致了。具体来说是芯片里的最小计算单元“mos管”已经不能再继续小型化了,继续强制做小mos管会出现“漏电”等问题并导致计算结果不准确。

“摩尔定律每五年增长 10 倍,并且每 10 年增长 100 倍。而现在芯片的性能每年只能增长几个百分点。每 10 年才只有 2 倍 ...... 将更多晶体管塞进一个狭小区域的费用和复杂性使得很难再让芯片性能的定期加倍。因此摩尔定律已经不再适用。——黄仁勋”

用老黄自己的话说就是——“摩尔定律”快要失灵了。这对于一个显卡制造商来说是个非常要命的问题,因为所有芯片类产品的核心卖点,就是算力。当算力的增长注定日渐疲软之时,芯片制造商就只能折腾一些新的幺蛾子出来当做卖点。

思考到这里我才晃过神来,才明白为什么从20系显卡开始,老黄咬死了“光追”“DLSS”……等当时来看技术并不成熟的概念大力宣传,以至于必须锁DLSS 3.0只给40系显卡开放。因为毫无疑问DLSS 3.0是一个非常宝贵的,能让用户直观体会到新一代显卡更强的机会。

同样我也理解了,为什么AMD和英特尔作为AI图形计算技术的后发者,愿意开源自己的技术(AMD家的叫FSR,英特尔家的叫XeSS)。因为从商业竞争的角度来说,开源不仅可以召集天下英豪为我所用,还能逐步肢解英伟达的销售战略,更要命的是从市场公关的角度来说,开源天然就站在道德的制高点,这么看AMD和英特尔可谓是一脚踩在了英伟达的命门上。

英特尔的XeSS只是部分开源

而且极其“巧合”的是,就在前两天AMD突然官宣,会在本月24日把一项名为AFMF的帧生成技术集成到正式版的显卡驱动中,届时所有6000系以上的A卡玩家,在升级驱动的时候就可以直接免费解锁这个功能。

等等……这个帧生成技术听起来怎么这么耳熟?没错你猜对了,这个所谓的AFMF技术,其内核就是开源的FSR 3.0……结合上文介绍的几位大佬发MOD的时间,我只能说AMD是真狠啊,不给老黄一点喘气的机会。

那说到这里,大家应该能明白为什么我说,老黄极有可能会在未来下方DLSS 3.0这个技术,甚至部分开源了吧。因为对于英伟达来说,与其逼着自家老用户骑墙用AMD的FSR或者英特尔的XeSS,还不如作为福利部分下放给老用户,培养一下DLSS的用户生态,运气好的话还能再捞回来点口碑。

最后希望大家不要误会,我不是在控诉英伟达抠门,也不是在刻意黑他赚钱有罪。其实恰恰相反,通篇梳理下来,你会发现英伟达作为行业的开拓者,在AI图形计算领域功不可没,甚至如果没有DLSS可能根本就不会有FSR、XeSS等一票AI图形计算技术。作为这个领域的先发者他有技术领先的优势,但同样也要承担后发竞争对手的反制措施,所以说再多都是无关道德,在商言商仅此而已。

我拿英伟达做案例,单纯是因为他的代表性太强了,英伟达是非常罕见的,同时在AI硬件和AI软件都非常强的公司。说个冷知识一个英伟达的市值等于7个英特尔、5个AMD、4个腾讯、2个半台积电……总市值1.39+万亿美元……

这是什么概念?即便是做出来了Chat GPT的当红炸子鸡OPEN AI,其总市值往猛了估也不到900亿美元,甚至从全球各国经济来看,截止到2023年末,全球一共有197个国家,其中年GDP超过1万亿美元的国家也就只有19个,占比不到10%……

但就是这么一个富可敌国的跨国集团,面对竞争对手开源挖墙脚,面对民间用户开源自给自足做MOD,他是一点办法都没有的,而且这些MOD的存在完全合法,完全正义,并且在全世界网民的支持下,只会越来越强大。

所以我觉得即便是真的到了出现邪恶超级AI的那天,我们还是会有属于全人类的正义开源超级AI。这不仅仅是因为我选择相信人性,更是因为从历史的进程来看,结果大概率也是这样。

最后,感谢开源主义精神,让科技的进步福泽万民,也感谢有像小黑盒这样的社区存在,让信息差不再成为垄断的工具!

0 阅读:0