Nvidia详细介绍RTX 30系列核心增强功能

英伟达于9月1日发布了RTX-30系列安培架构，庆祝其首款GPU GeForce 256诞生21周年。功能和规格无疑令人印象深刻，您可以在我们的GeForce RTX 3090，GeForce RTX 3080和GeForce RTX 3070故障。但是，我们最后提出了很多问题，Nvidia提供了许多其他信息，在此我们进行了总结。我们将在主要的Ampere体系结构中心中添加很多内容，因此这只是新的细节。

Nvidia Ampere体系结构-更多详细信息和性能指标

首先，让我们谈谈Ampere流式多处理器(SM)。游戏最大的变化可能是FP32性能提高了一倍。现在，每个SM具有两个FP32群集，每个周期最多可提供128个FMA(融合多加)操作。其中一半是完整的FP32 + INT内核，而另一半仅是FP32。这听起来像是一个潜在的问题，但是通常来说(尤其是对于游戏工作负载)，FP32是最重要的，而INT则不是。这是一种平衡的方法，可以提高整体性能，而不会过多消耗内核。

为了帮助喂食野兽(TM!)，数据路径以及L1带宽增加了一倍。L1容量也增加了33%，是分区大小的两倍。

进行的其他更改之一是，Ampere可以同时通过CUDA内核，RT内核和Tensor内核运行工作。这允许游戏运行DLSS来升级一帧，同时为下一帧进行CUDA和RT计算，从而减少了渲染时间并提高了整体性能。

对于RT内核，Ampere还添加了插值三角形位置的功能。这对于诸如运动模糊之类的事情尤其重要，在运动模糊中，并非每个用于渲染场景的三角形都处于相同的位置或时间。我仍然不是游戏中运动模糊的忠实拥护者，即使它看起来更逼真，但无论如何。此更改可能使射线遍历速度提高8倍，因此这是重要的补充。

这就是真正的新信息。其余大部分是以前已知的细节，但是我们为想要查看更多内容的人提供了下面的完整幻灯片。还有更多细节可以了解Wolfentstein Youngblood以及RTX IO的性能(我们在讨论Microsoft DirectStorage和RTX IO时已在其他地方介绍过)。

Nvidia详细介绍RTX 30系列核心增强功能

相关推荐