Nvidia详细介绍RTX 30系列核心增强功能

英伟达于9月1日发布了RTX-30系列安培架构,庆祝其首款GPU GeForce 256诞生21周年。功能和规格无疑令人印象深刻,您可以在我们的GeForce RTX 3090,GeForce RTX 3080和GeForce RTX 3070故障。但是,我们最后提出了很多问题,Nvidia提供了许多其他信息,在此我们进行了总结。我们将在主要的Ampere体系结构中心中添加很多内容,因此这只是新的细节。

Nvidia Ampere体系结构-更多详细信息和性能指标

首先,让我们谈谈Ampere流式多处理器(SM)。游戏最大的变化可能是FP32性能提高了一倍。现在,每个SM具有两个FP32群集,每个周期最多可提供128个FMA(融合多加)操作。其中一半是完整的FP32 + INT内核,而另一半仅是FP32。这听起来像是一个潜在的问题,但是通常来说(尤其是对于游戏工作负载),FP32是最重要的,而INT则不是。这是一种平衡的方法,可以提高整体性能,而不会过多消耗内核。

为了帮助喂食野兽(TM!),数据路径以及L1带宽增加了一倍。L1容量也增加了33%,是分区大小的两倍。

进行的其他更改之一是,Ampere可以同时通过CUDA内核,RT内核和Tensor内核运行工作。这允许游戏运行DLSS来升级一帧,同时为下一帧进行CUDA和RT计算,从而减少了渲染时间并提高了整体性能。

对于RT内核,Ampere还添加了插值三角形位置的功能。这对于诸如运动模糊之类的事情尤其重要,在运动模糊中,并非每个用于渲染场景的三角形都处于相同的位置或时间。我仍然不是游戏中运动模糊的忠实拥护者,即使它看起来更逼真,但无论如何。此更改可能使射线遍历速度提高8倍,因此这是重要的补充。

这就是真正的新信息。其余大部分是以前已知的细节,但是我们为想要查看更多内容的人提供了下面的完整幻灯片。还有更多细节可以了解Wolfentstein Youngblood以及RTX IO的性能(我们在讨论Microsoft DirectStorage和RTX IO时已在其他地方介绍过)。

(0)
上一篇 2022年3月27日
下一篇 2022年3月27日

相关推荐