当前位置:首页 > 软件资讯 > 英伟达RTX 40系显卡解析:出色工艺带来出色性能,DLSS 3是杀手锏

英伟达RTX 40系显卡解析:出色工艺带来出色性能,DLSS 3是杀手锏

分区:软件资讯 更新:2022-09-27 14:34:35

Nvidia在9月20日深夜举行主题演讲,正式推出RTX 40系列显卡,包括黄卡RTX 4090、RTX 4080 16GB和RTX 4080 12GB。它们基于新设计的阿达洛芙莱斯GPU架构。除了全面提升显卡规格,Nvidia还带来了全新的DLSS 3和光线追踪计算单元以及40系列显卡的两个重要渲染引擎,渲染性能更加出众。

Nvidia于9月20日深夜举行主题演讲,正式推出RTX 40系列显卡,包括黄卡RTX 4090、RTX 4080 16GB和RTX 4080。

12GB,基于新设计的阿达洛芙莱斯GPU架构。除了全面改进显卡规格之外,Invista还为40系列显卡带来了新的DLSS。

3.凭借光线追踪计算单元和两个重要的渲染引擎,渲染性能更加出众。

\但是随之而来的是整体价格的上涨,尤其是80系显卡。相比30系显卡,价格提升非常明显。那么40系显卡给我们带来了哪些新功能呢?这些功能值得消费者付费吗?

阿达洛芙莱斯芯片:全新技术,强劲性能

首先,让我们来谈谈这个由第一位女性程序员阿达洛芙莱斯命名的架构。作为国王,RTX

490显卡的核心就是这个AD102核心。整个核心的面积是604.2平方毫米,与RTX相比。

30系列显卡数量也有所减少,但晶体管数量却大幅增加至763亿。

\关于整体架构,Ada

洛夫莱斯好像和安培差不多。一个计算单元包括FP32计算单元,FP32和INT32共享的计算单元,第四代张量。

Core,还包括第三代RT计算单元,让深度学习和轻追更高效。

总的来说,艾达

与安培相比,洛夫莱斯进步神速。比如图形处理集群的数量从7个增加到12个,使得计算单元的数量从84个飞跃到144个。也就是说,一个完整的Ada核心最多可以提供18432个流处理器,远远超过GA102的10752个。此外,光学跟踪单元从84个增加到144个,深度学习单元从336个增加到576个,频率从1.9GHz增加到2.5GHz,Ada芯片之所以能有这么大的参数提升,主要原因是制造工艺的进步。在ampere工艺中,Nvidia采用了三星的8nm工艺,而在Ada时代,采用了定制的TSMC的4nm工艺,大大提高了晶体管密度,使得芯片即使面积缩小,晶体管数量也增长得如此凶猛。

\此外,英伟达还表示,在爱达

GPU的功耗比是安培的两倍,shader的渲染能力达到83TFLOPS,也是上一代的两倍,光线追踪能力飙升至191TFLOPS,是上一代的2.8倍。深度学习相关的FP8张量计算已经达到了恐怖的1.32PFLOPS,是上一代的5倍核心。在游戏方面,英威达也宣称Ada的光栅性能是安培的两倍,是后者的四倍。

RTX玩家请拨打\

40系显卡还大幅提升了运行时的功耗性能,运行更加流畅,不会出现大规模的瞬时功耗增加,这对于想要获取高功率的玩家来说尤为重要。毕竟高端电源,1W以上的电源,可能要1.2元甚至1.5元的预算。也正是因为如此强大的计算性能,Ada才能成为

GPU可以做更多的工作,比如DLSS 3,被老黄视为革命性的AI帧生成技术。

DLSS 3:让AI生成帧,帧率大幅提升

\DLSS是Nvidia的深度学习反走样技术。借助英伟达的AI神经网络,减少了GPU的画面渲染,从而改善了游戏的画面。自从图灵架构开始,DLSS已经被消费者认可。就这样,提升画质的黑科技也经历了三代。第一代DLSS使用了显卡本身的AI驱动和神经网络来渲染画面,但是由于计算能力的限制,实际效果并不理想。虽然帧速率有所提高,但画面非常模糊,尤其是在某些dynam中

在2.0时代,英伟达选择了类似DSR的技术,先让显卡以较低的分辨率渲染,然后利用AI计算能力将画面变成高分辨率输出。当然,与第一代DLSS相比,第二代DLSS无论是效果还是厂商接受度都有了质的提升,消费者也越来越接受这项技术。此外,朋友们还使用FSR和XeSS来达到与DLSS相似的效果。在DLSS

3时代,不再满足于传统图形渲染的Nvidia开始用AI创建自己的渲染图,并通过插入到两个渲染图中来进一步减轻GPU的渲染压力。

\首先,Nvidia在Ada GPU上加了一块叫做光流加速器的硬件,它还实现了DLSS。

3核心.首先在光流加速器的帮助下,GPU对画面中运动物体的矢量数据进行分析,然后让AI自动渲染游戏画面,并根据卷积神经网络将其插入到正常的游戏画面中,可以有效提高游戏帧率。另外,这种渲染方式也是在游戏渲染领域的首次应用,前提自然是40系的巨大张量。

核心计算集群。

英伟达表示,DLSS

3可以使用AI渲染高达7/8的显示像素,帧率比没有DLSS的游戏高4倍。对于开启追光效果的游戏尤其有效。

\为例,发布会上公布的《赛博朋克2077》从22帧左右跃升到90多帧。甚至因为所有的图像帧都是在GPU上进行的,不经过CPU,所以即使你没有强大的CPU,游戏帧率也能显著提升。

\但是,有人会担心,由于采用了AI渲染帧,并插入到两个正常渲染帧之间,会导致画面延迟上升。对于拥有3A大作的玩家来说,延迟可能不是问题,但是对于FPS玩家来说,延迟就更重要了。英伟达表示,游戏开发者和游戏玩家可以使用NVIDIA。

Reflex有效降低了游戏的传输延迟,让即使开启DLSS 3特效的玩家也能享受到理想的延迟。

\ \当然,DLSS 3并不是所有RTX显卡都能享受到的。由于缺乏光流加速器,RTX 20和RTX

30系列显卡直接告别它。此外,英威达还提供了一张关于DLSS的特效表,其中AI渲染和插帧技术为RTX 40系列显卡所独有,而RTX

40/30/20系列显卡都支持原厂屏幕缩放功能。至于NVIDIA反射,这个特效可以从GTX 900系列显卡支持。目前,超过35个游戏支持DLSS。

3.我们将在10月份与您见面。

新的渲染引擎:更高效的图形渲染

随着RTX显卡性能的提升,尤其是24GB超大显存的RTX 4090显卡的出现,以及NVIDIA

随着Studio驱动的到来,越来越多的工作室开始购买GeForce游戏显卡作为图像渲染卡,英威达也一直在游戏显卡中塞入全新的渲染引擎,让这些专业人士拥有更高效的图形和画面渲染。

\这次加的引擎是不透明的。

微遮罩引擎和微网格引擎,前者用于光线跟踪渲染。有了这个引擎,Alpha-Test在光线跟踪方面的几何性能提高了2倍。而后者是在不消耗存储资源和采用简单BVH的前提下,提高渲染图像的丰富性。图像建模速度相比过去也有了很大的提升,这个功能也得到了Adobe等专业应用厂商的认可。

另外,老黄还在RTX。

40系列显卡支持着色器重新排序。像CPU的乱序执行一样,渲染任务队列可以根据实际需要改变,从而大大提高图像的渲染效率和GPU的利用率。转换成游戏,游戏性能提升25%左右,追光性能提升高达3倍。

目前与英伟达

用Studio等的应用。驱动,游戏卡和职业卡的界限越来越模糊。借助最新技术,专业用户也能享受到新一代GPU带来的卓越工作效率。毕竟,RTX

490对玩家来说不仅仅是显卡。

集成八代NVIDIA编码器:视频和直播用户的最爱

\目前直播以及视频制作的兴起也让GPU应该有更多的编解码性能,而英伟达这次在RTX,

40系列显卡增加了双NVIDIA编码器,可以减少视频输出时间高达50%。同时还支持AV1编解码,比如OBS和Blackmagic设计。

达芬奇Resolve等设计和直播软件还加入了NVENCAV1编码器,可以让RTX 40系列显卡有发挥的空间。

\NVIDIA

广播软件开发套件增加了人脸表情估计、眼球追踪、虚拟绿屏画质提升三大功能,使得直播 UPmaster直播声音更具沉浸感,当然对会议用户也是大有裨益。

黄卡性价比最高

最终我还是绕不过这个RTX 40系列显卡核心的争议点就是价格。由于较高的晶圆制造成本和汇率,英伟达RTX 40系列显卡的建议零售价与RTX相比。

30系的提升也在意料之中,但出乎意料的是,这次的显卡涨价实在让消费者难以接受。RTX 4080 12GB售价7199元,而RTX

4080 16GB的价格是9499元,相对于RTX 3080 5499元的建议零售价来说太猛了。万王之王RTX。

而490反而是三款显卡中性价比最高的,因为12999元的建议零售价要比上一代高出1000元。当然,改进的性能范围显然配得上黄卡的价格。

\,而另外两款就不一定了。RTX 4080 16GB采用9728 CUDA核心,配备16GB GDDR6X内存。其性能是RTX 3080的两倍。

Ti,而RTX 4080 12GB采用7680 CUDA核心,配备12GB GDDR6X内存,性能也超过RTX。

3090提.在官方游戏性能上,光栅游戏下,RTX 4080 12GB等于RTX 3090 Ti,部分游戏略输,而RTX 4080

16GB比RTX 3090 Ti高20%左右。

\对于Invista,显然需要RTX。

480系列显卡有很强的性能让消费者接受这两款显卡。毕竟经过两年的挖掘,消费者的热情已经到了谷底,想要恢复并不容易。

  • 最新资讯
  • 最新软件