nvidia geforce rtx 3000,rtx3000显卡什么级别

文/冯望月

英伟达(NVIDIA)自8月和9月以来一直成为新闻焦点,其市值超过英特尔+AMD的总和,如今已超过3400亿美元。另一个是基于NVIDIA Ampere架构的GPU的发布。 GeForce RTX 30系列显卡——代表RTX 3080、RTX 3070和怪兽RTX 3090。

发布会上,范师傅表示,这一代RTX 30系列显卡受益于NVIDIA Ampere架构,其性能相比公认的上一代RTX 20系列显卡来说是巨大的跳跃。其中,新一代旗舰显卡RTX 3080可以实现RTX 2080两倍的性能。就连主流市场的RTX 3070也超过了之前售价过万元的RTX 2080Ti旗舰显卡。至于RTX 3090,其定位已经是传统TITAN RTX系列,性能是后者的1.5倍。

照片:好东西看上去很奢华(贵)

新一代旗舰显卡RTX 3080的实际性能有那么好吗?还记得之前的RTX 20 系列在开启光线追踪和DLSS 后帧率突然下降的情况吗?请继续关注9 月17 日发布的实际性能和数据。

那么在这篇文章中,我们将主要看看NVIDIA Ampere 架构给GPU 带来了哪些魔力。换句话说,NVIDIA Ampere架构和上一代Turing架构有什么区别?

首先我们看一下数据——

如上表所示,RTX 3080 GPU 拥有280 亿个晶体管,这得益于与三星合作的8N 工艺(我们怀疑这是特殊的而不是简单的8nm 工艺),比上一代RTX 多了近10 亿个。 2080Ti —— 体积从754平方毫米减少到628平方毫米。

因此,RTX 3080也有68个SM模块,但拥有8704个CUDA核心,比RTX Super多2.8倍,几乎是RTX 2080Ti的两倍。用于计算神经网络的Tensor Core 和负责光线追踪的RT Core 数量看起来与RTX 2080Ti 上相同甚至更少,但效率却大不如前。我们还提到了重新设计的RT 内核。稍后我们将探讨Tensor Core 的伟大之处。

GPU的主频和Boost频率也受益于新的制造工艺,基础频率达到1440MHz,部分私有版本预计会大幅提高这一上限。视频内存、带宽和功耗各不相同。

重新设计的着色器、Tensor 核心和RT 核心与之前的Turing 相比,NVIDIA Ampere 架构的最大变化是每个SM(流式多处理器)分区现在每个时钟周期支持32 个FP32(32 位浮动多处理器)操作。执行操作的能力。这允许SM 中的所有四个分区组合在一起,每个时钟周期执行128 次FP32 操作,是—— 吞吐量的两倍。对于图形渲染、着色器工作和计算直接受益于FP32 的计算速度,光线追踪等新兴技术也由FP32 进一步提供支持。

作为显卡GPU 的基础,着色器自GPU 诞生以来就一直被用作渲染图形的特殊可编程设备。前者负责绘制三角形。 3D模型(根据建模的复杂程度可以分为无限多个三角形),后者负责2D图形的像素渲染。

自从CUDA诞生以来,NVIDIA的GPU就开始从专门用于图形渲染的可编程着色器发展到通用计算。此前,基于NVIDIA Ampere架构的RTX 30系列显卡具有可编程着色器,将其处理能力从11 Shader-TFLOP/s LOPS提升至30 Shader-TFLOP/s。 FP32 浮点吞吐量是传统的。图灵架构的2.7倍。

照片:新着色器的性能提升了2.7 倍,RT 核心和Tensor 核心的性能也分别提升了1.7 倍和2.7 倍。

当Turing架构中引入Tensor Core(张量计算核心)和RT Core(光线追踪核心)时,我们相信相对于——的CUDA Core,这两个核心无疑将成为我评论的未来显卡的基础。确实如此。对于通用计算,GPU本身就是通用处理器,因此需要卸载用于深度学习推导的繁重光线追踪操作(RTX-OPS)和张量计算(Tensor Flops)以提高效率。

NVIDIA的雄心和勇气在整个游戏行业还只有几款游戏的时候推出了这两款领先于时代的核心。很多游戏都开始支持光线追踪,而DLSS在基于深度学习技术和超级采样的Tensor Core的支持下,终于可以在更多真实的游戏中发挥作用了。不过不少玩家仍然诟病,如果真想全面启用DLSS,就需要购买旗舰RTX 2080Ti。

现在怎么样?新一代RTX 3080的基础是NVIDIA Ampere架构——,这是今年GTC America上发布的最重要的GPU核心架构。其中最重要的是第三代Tensor Core(张量计算核心),如图所示。如下表所示。

NVIDIA A100 Tensor Core GPU 性能数据

照片:数据取自A100白皮书

这是NVIDIA 在其数据中心用于深度学习的A100 GPU 的数据,但其第三代Tensor Core 的性能仅是RTX 3080 上原始V100 的近两倍,在NVIDIA Ampere 架构上也没有。 Tensor Core 提供238 Tensor-TFLOPS 的计算能力。另一方面,最初的RTX 2080Ti 只有89 Tensor-TFLOPS。 —— 性能提高了近3 倍。

图:新一代DLSS 2.0是在超级计算机的支持下,使用4K图像进行深度学习训练生成的模型(训练顺序中支持每个游戏)

凭借对最新DLSS 2.0 的支持,即使在相同的4K 分辨率下,您也可以期待图像比以往更清晰,这要归功于Tensor Core 强大的推理功能。据说超级计算机可以帮助消除锯齿—— 图像。详细你就明白了。

同时,第二代RT核心的性能也较上一代提升近两倍,并支持同步光线追踪处理和着色。数据方面,RTX 2080Ti 的光线追踪性能为34 RT-TFLOPS,而RTX 3080 的RT 核心数量与之前相同,但性能提高到58 RT-FLOPS,从而允许更多计算。许多灯光和路径同时运行。

图:第二代RT核心性能提升1.5倍以上

光线追踪的最终目标是使计算机图像尽可能接近真实的物理效果。 —— 在传统的光影环境中,GPU使用光栅来处理光影关系。换句话说,它将3D 图形映射投影到对象上。它处理2D 平面、每个点的亮度、颜色等。这样,最终组合时,得到3D图像——,与MRI(核磁共振)的切片成像原理非常相似。然而,由于有限的计算能力和编程复杂性,程序员只能简化光影逻辑,往往为只有一两个光源的物体添加更多的光源,从而变得更加复杂。对场景设计和计算提出了更高的要求。

光线追踪是我们实际看待事物的方式。光源(如灯或太阳)发出—— 条光线,照射到物体上,然后反射回我们的眼睛,使我们看到明亮和黑暗的区域。颜色等光线追踪模拟这样的过程,并简单地定义光源和材料的物理属性,例如它的反射程度或漫射程度。这样做的好处是简化了编程难度,如果能够最大限度的还原现实,就可以还原整个世界的光影。无法实现这一点的原因是它需要几乎无限量的计算——。

RT Core的引入,就是为了这个目的专门分离出GPU内部的一些核心,尽可能的提升性能,在处理光影的时候“专门化”。

照片:如果我不告诉你这是一个光线追踪的虚拟世界,你会相信吗?

自从微软在2023 年底正式将Ray Tracing (DXR) 光线追踪技术添加到DirectX 中以来,越来越多的游戏开始使用这项技术来让他们的世界变得完全真实,而NVIDIA 也正在积极推广该技术。 RTX 3080 再次将光线追踪提升到新的高度。

3个经常被忽视的技术亮点如果说RTX 3080的显着性能提升是由于制程技术给它带来的28亿个晶体管以及新的NVIDIA Ampere架构带来的改进的话,那么两者之间存在三个主要区别。将显卡和计算GPU 放置在—— 上。

1.GDDR6X显存的强大

NVIDIA为这一代RTX 3080旗舰显卡配备了全球最快的显存,——GDDR6X显存。与RTX 2080Ti 中使用的GDDR6 显存相比,显存位宽似乎是320 位,而不是352 位。降低?事实上,显存消息传输速率从14Gbps 提高到了19Gbps,带宽从GDDR6 的616GB/s 提高到GDDR6X 的760GB/s。

图:发布会上的“眼图” —— 学会了沟通的朋友看起来很友善。

在“眼图”中您可以清楚地看到,GDDR6X 在同一时间段内以250mv 步长发送4 个不同的信号(380 ps,1 ps 等于万亿分之一秒)。 信号电平(形成3行4个大眼睛)——为4*4=16。上图左侧显示了上一代GDDR6 在500 ps 内传输两个电平。 ——发送的信号是2*8=16。

如果左侧和右侧发送相同数量的消息,您会发现右侧花费的时间是左侧的70%。换句话说,GDDR6X 比GDDR6 快30%。这也与美光官网宣传的系统带宽改进相一致。

据NVIDIA介绍,这是由于GDDR6X内存中使用的PAM4多级信号技术,该技术是与美光合作设计的,实际上在通信领域非常受欢迎,尤其是200G以上的光通信中包含脉冲幅度调制。 /s 很常见。采用QSFP64模块,内部信号调制以PAM4为主。一些聪明的朋友开始思考NVIDIA Game Cloud (GeForce Now) 中的GPU 如何能够直接通过Mellanox 的高速网络使用相同的调制信号来绕过CPU 并实现GPUDirect(这个秘密我们会及时通知您)。自己去发现)。

2.RTX I/O技术

什么是NVIDIA RTX I/O技术?这意味着GPU可以绕过CPU直接访问高速存储。

HDD时代,打开游戏的过程是通过南桥控制芯片将数据从硬盘加载到内存,这一切都是由CPU控制的,然后GPU通过CPU从内存读取数据,放入在它自己的视频内存中。虽然效率较低,但瓶颈主要是HDD机械硬盘的延迟和速度。

不过,现在PCI-E已经从3.0进化到4.0,NVMe SSD的速度也有了明显的提升。因此,之前的数据访问过程显得非常缓慢。 —— 为什么不直接从SSD读取数据到显存?

从上图可以看出,从PCI-E Gen4 NVMe SSD读取的数据通过磁盘控制器通过PCI-E总线直接放到显卡上。这就是NVIDIA 的RTX I/O 技术。这种数据访问操作绕过了CPU和本地内存,完成了从存储到显存的数据链路的直接调度。

在这种应用场景下,您不仅可以充分利用PCI-E 4.0的高速带宽来解锁NVMe SSD的速度,而且您的玩家无需等待那么长时间才能打开游戏,您的游戏体验也将更加出色。系统将经历更少的延迟它可以缩短到。感受一下游戏的加载时间。

3. REFLEX低延迟技术

黄领导首先提到了NVIDIA REFLEX低延迟技术。这其实可以理解为支持GeForce RTX显卡和G-Sync新技术,通过优化减少系统和游戏延迟,最高刷新率为360Hz。竞技比赛的对抗水平也显着提高。

当吃鸡游戏刚开始流行时,很多玩家能够使用Joy 144Hz显示器和支持G-Sync的好显卡来玩60Hz刷新率的游戏,这很重要。一种不同的体验。事实上,你的眼睛比其他人看到的内容更多,而这几毫秒是实现目标的关键时刻。

事实上,RTX 30系列显卡配备了许多新的设计功能,包括效率是上一代散热器两倍的双轴散热设计、更快的8K HDR视频录制和编辑以及更快的AV1解码。提高不同级别的玩家体验。请等待明天发布的具体评测——。

RTX 3080 显卡的标准基准分数:

3DMark Fire Strike —— 解释了DirectX 11 与上一代显卡相比的改进

3DMark Time Spy ——DirectX 12 基准测试

3DMark Port Royal —— 显卡光线追踪基准测试

3DMark DLSS —— 深度学习超级采样测试

游戏测试:

奇点的灰烬:扩展版(奇点的灰烬:升级)——没有人真正玩过这个游戏。大家都用这个游戏来做DX12基准测试。

《刺客信条:奥德赛》—— 所有平等基准

Fortnite ——是一款支持光线追踪的在线游戏

控制——款支持DLSS 2.0的游戏

Wolfenstein: Youngblood (Wolfenstein : Youngblood) —— 光线追踪和DLSS 测试

边境(Border Benchmark)——款国产大作游戏,光线追踪兼容

光明记忆:无限(光明记忆: Infinity)——国内著名大作,采用虚幻引擎4.9打造,光线追踪+DLSS测试

Metro Exodus —— 是第一款支持光线追踪和基准DLSS 的游戏

Minecraft(光追版)(MineCraft (RT))—— 不用说

《古墓丽影:暗影》—— 光线追踪和DLSS 测试

《古墓丽影:崛起》—— DirectX 12 初始基准测试,游戏也支持DirectX 11

更多测试:敬请关注职业玩家的一些未公布的小测试。

本文和图片来自网络,不代表火豚游戏立场,如若侵权请联系我们删除:https://www.huotun.com/game/622363.html

(0)
上一篇 2024年5月27日
下一篇 2024年5月27日

相关推荐

  • 和平精英怎么查看所有枪械皮肤?

    和平精英怎么查看所有枪械皮肤? 在商场武器里面找到枪就能看到全部皮肤 和平精英没有枪皮肤怎么办? 如果和平精英没有枪皮肤,可以通过不断的参加游戏和完成任务来获取金币和经验值,用它们来购买枪皮肤或者开箱子获得更多深受欢迎的枪皮肤。 此外,也可以参加游戏比赛或者活动,赢得排名奖励和赠品。总之,有许多方式可以获取更多的枪皮肤,即使刚开始没有也不必担心。在游戏中不断…

    游戏快讯 2小时前
  • 和平精英怎么样屏蔽防具?

    和平精英怎么样屏蔽防具? 和平精英屏蔽防具方法是 玩家可以直接点击屏幕最下面的仓库。 然后在左边,有个展示设置,点击进入,就可以选择最后一个战斗中,其中有个隐藏头盔,玩家直接点击把前面的勾给取消掉,这样的话就可以把自己的头盔给隐藏掉,无论是一级、二级、三级头盔都不会显示,不过这个只是对于自己有效果,如果你以你队友或者敌人的视角来看,还是会依然存在。 和平精英…

    游戏快讯 4小时前
  • 和平精英怎么练反应? 和平精英颜色怎么调?

    和平精英怎么练反应? 1、首先,要先找到适合自己的枪械,然后练习压枪。其次要练习打靶的准确度。打靶时先练习固定靶,在固定靶射击稳定的前提下练习射击移动靶。保证枪口能够找到敌人的位置。   2、在练习好射击精度之后,要练习开镜后迅速找人锁定目标的技能,开镜练习直接开镜和左右探头开镜,训练反应速度。   3、练习好射击精度和开镜反应速度之后,就要练习移动情况下的…

    游戏快讯 5小时前
  • 和平精英怎么获得电摇兑换码?

    和平精英怎么获得电摇兑换码? 电摇没有兑换码,只能在商城里面用物资币兑换攒够60个物资币即可兑换电摇,可以用阅换码去约换服饰币,攒够符石必须兑换电摇 和平精英CPU兑换码? 康师傅兑换码:需要购买官方合作款的香辣牛肉面,然后用微信扫描料包上的二维码。在小程序“召唤空投”中可以获取军需礼包。 玛莎拉蒂兑换码:官网赠送钥匙兑换码,无法从其他平台获取,建议不要购买…

    游戏快讯 6小时前
  • 和平精英极限追猎怎么飞不了?

    和平精英极限追猎怎么飞不了? 答:和平精英极限追猎你要点两下跳跃才可以飞起来。 和平精英极限追猎飞不了? 和平精英游戏中,追猎模式玩家之所以能飞是因为穿上了【外骨骼腿甲】,这个装备搭载着推进器,只要点击推进功能特种兵就可以上天。外骨骼腿甲,是在矩阵基站中用纳米晶体和蓝图合成而来的。 和平精英极限追猎飞不起来? 和平精英极限追猎是在创意工坊里面的模式。它是进入…

    游戏快讯 11小时前