Nvidia GeForce RTX 3080 Founders Edition 已经登陆,随之而来的是 PC 游戏世界多年来从未经历过的期待浪潮。经过数月的泄密和谣言后,Nvidia 在本月初推出了 RTX 30 系列显卡,称其为公司历史上“最伟大的代际飞跃”,提供了上一代显卡“高达 2 倍的性能” 。可以?我们已经对该卡进行了测试,以了解它的实际威力以及这是否是您一直在等待的升级。
设计与特点
RTX 3080 拥有令人印象深刻的规格表。与上一代 RTX 2080 Super 相比,它的 CUDA 核心数量增加了一倍以上,拥有多达 8704 个核心和 10GB 320 位 GDDR6X VRAM。 GDDR6X 是当今最新、最快的视频 RAM,最大带宽为 19 Gbps,比图灵的 14 Gbps 有了大幅提升。该卡速度很快,升压时钟为 1.71 GHz,不过 Nvidia 声称它也很节能,每瓦性能是 20 系列的 1.9 倍。
我们很容易将扩展的 CUDA 核心数量与 Nvidia 声称的“高达 2 倍的性能”划清界限,但事情并非那么简单。对于 Ampere,CUDA 核心数量不会与性能成 1:1 比例,因为大约一半的核心可以根据当时的需要在 FP32 着色器核心和 INT32 整数核心之间切换。游戏引擎和应用程序利用这些核心的方式各不相同,因此虽然可以放心地期待性能的提高,但每个游戏的运行速度不会突然提高两倍。
Founders Edition 还配备了 Nvidia 最新版本的 RTX 三处理器系统。 RTX引擎由三部分组成:可编程着色器,负责标准光栅化职责(正常游戏渲染); RT Core,处理光线追踪; Tensor Core 为 RTX 的 AI 部分提供支持,支持 DLSS 和 RTX 语音等功能。
这些系统中的每一个都获得了巨大的整体提升,着色器提高了 2.7 倍,RT 核心提高了 1.7 倍,张量核心提高了 2.7 倍。与 RTX 20 系列相比,其万亿次浮点运算数量令人震惊:
RTX 3080 Founders Edition 还配备了 Nvidia 的新型双轴冷却器。与上一代 Founders Edition 散热器相比, 感觉 就像一个巨大的散热器,其中最后一个或多或少感觉像一个抛光的金属块。 PCB 已缩小,但整体尺寸保持相似,从而允许更大的表面积用于散热。冷却器中嵌入了两个风扇,它们与大多数中塔式机箱的自然气流路径协同工作。最靠近卡前部的风扇将空气通过其裸露的翅片组吸入,然后将其从机箱背面排出,就像鼓风机式冷却器一样。后风扇位于显卡的另一侧,将空气向上拉并通过 CPU 的路径排出。 Nvidia 声称该设计比上一代产品温度降低了 20 摄氏度,噪音降低了 3 倍,虽然它更凉爽、更安静,但我并没有完全看到这样的结果。尽管如此,它的独特设计效果很好。
Nvidia 的新型 12 针电源连接器以一定角度位于冷却器侧面。值得庆幸的是,您不需要购买新的 PSU 来容纳新的连接器:Nvidia 在包装盒中提供了一个适配器,可将两个 8 针接头转换为单个较小的连接器。也就是说,我宁愿 Nvidia 继续使用普通的双 8 针连接器,因为适配器从卡的侧面悬挂起来看起来不太好,特别是如果你有定制电缆的话。
不过,如果您运行的是中端电源,您可能仍然需要升级。 RTX 3080 对功率的渴望很高,额定 TDP 为 320 瓦。这比 2080 Super 和 2080 Ti 的 250 瓦有所提高。除此之外,还建议使用至少 750 瓦的电源,并且每个 8 针连接器应该是来自 PSU 的单独电线 - 没有分叉端。
在连接方面,该卡具有三个 DisplayPort 1.4 连接和一个 HDMI 2.1 端口。与上一代一样,RTX 3080 FE 能够输出广色域 HDR 内容,并支持显示流压缩,为支持的显示器提供高带宽吞吐量。这些输出可以在四台显示器上实现 7680x4320 的最大分辨率。
RTX IO、RTX Reflex 和 RTX 广播
除了显卡本身之外,RTX 30 系列的发布还带来了几项额外的公告。其中最重要的是RTX IO,它允许直接从SSD进行基于GPU的解压,这将极大地扩展其带宽。与 PlayStation 5 一样,它有望在游戏中实现近乎瞬时的加载时间,但由于它需要开发人员集成,因此我无法在本次评测中对其进行测试。
宣布的其他核心功能包括 RTX Reflex 和 RTX Broadcast。 RTX Reflex 直接针对电子竞技游戏玩家,承诺在 4K 运行游戏时大大降低系统延迟。过去,以高分辨率运行游戏,尤其是在高图形设置下,会导致更高的系统延迟,使游戏感觉响应速度较慢,并可能影响您的目标。 RTX Reflex 监控并优化帧渲染以减少延迟,特别是在 GPU 受限的场景中。
为了在 GPU 绑定场景中测试该程序,我将 RTX 3080 替换为我之前在测试中使用的 GTX 1660 Super,并加载了 Valorant。在我的 4K 显示器上,通过启用 Reflex+Boost 设置,我能够将系统延迟减少近 50%。我不是一名竞技电子竞技选手,所以我预计我可能会失去大部分这种改进(我们这里的时间不到 15 毫秒),但即使对我来说,它也确实感觉稍微快一些。如果您是那种需要各种优势的游戏玩家,那么没有理由不利用 RTX Reflex,特别是因为它目前已在或计划用于主要的第一人称射击游戏,如《使命召唤:现代战争》、《堡垒之夜》、和《Apex 英雄》。
另一方面,RTX Broadcast 的目标受众是创意人员和主播,而不是竞技游戏玩家。使用每个 RTX 卡内置的 AI 功能,您可以应用背景噪音消除和虚拟背景效果等设置。当然,我们已经在其他软件中看到了此功能,但人工智能增强功能为每个软件提供了比我以前见过的更高的保真度。英伟达展示了人工智能降噪功能,可以过滤掉主播所在房间内的真空声音,同时对声音质量的影响最小。同样,人工智能驱动的背景效果似乎同样高保真,有效地将流媒体从他们的环境中剔除,只有轻微的边缘。如果您的流媒体空间对于真正的绿屏而言过于有限,那么这尤其令人兴奋。
背景知识已经足够了,让我们进入基准测试。
表现
这项技术令人印象深刻,但真正重要的是它在压力下的表现。为了测试这张卡,我对它进行了一系列综合和游戏内基准测试。所有测试都是在超设置下进行的,以了解它如何处理最有压力的情况。在这些测试之后,我还进行了一些具体测试,看看 3080 相对于其前身提供了哪些光线追踪改进。
让我们从综合基准开始,重点关注光栅化:
RTX 3080 明显领先于我们测试的其他显卡,在 3DMark Fire Strike Ultra 中比 2080 Super 提高了 56%,在 Unigine Heaven 中比 2080 Super 提高了 47%。这些都是巨大的飞跃,但更引人注目的是相对于 2080 Ti 的领先优势,2080 Ti 在 Fire Strike 中最高达到 28%,在 Heaven 中最高达到 18%。
关于游戏性能:
简而言之:RTX 3080 Founders Edition 是一款光栅化引擎。它显然领先于我测试的所有其他卡——这并不奇怪。什么 做过 让我惊讶的是有多少。与 2080 Super 相比,它在 1080p 下的 FPS 提高了 29% 到 51%,平均 FPS 提高了 44%。 4K 下的改进更为引人注目,改进范围为 53% 到 67%,FPS 平均提高 57%。
即使与上一代旗舰产品 RTX 2080 Ti 相比,RTX 3080 仍然胜出,尽管利润率预期较小。 1080p 下 FPS 提升了 6% 到 24%,4K 下 FPS 提升了 17% 到 34%,平均分别提升了 18% 和 26%。考虑到这两张卡的相对定价(699 美元与 1199 美元),RTX 3080 感觉物超所值。
我还花了一些时间测试其他游戏,专门与 2080 Super 进行比较。由于它是 RTX 3080 的直接对应产品,因此它是说明新一代性能提升的重要指标。这些测试在启用光线追踪和 DLSS 的超级设置下以 4K 运行:
这些令人印象深刻的结果说明了 RTX 3080 所带来的飞跃。这是一款 4K 卡,绝对兑现了 4K 游戏的承诺,包括光线追踪。这也标志着我们从 10 系列跃升到 20 系列的过程中发现的提升有了实质性的改善。
这里需要注意的是,与上一代相比的增益将根据您正在玩的游戏、使用的设置以及游戏引擎利用 RTX 3080 改进的处理能力的优化程度而有所不同。我进行的游戏采样和测试显示,与 20 系列相比,它有了有意义的飞跃,尤其是在 4K 分辨率下玩时。
光线追踪性能
光栅化只是 RTX 系列的一个因素:另一个因素当然是光线追踪性能。由于两款下一代游戏机都提供硬件级光线追踪,我很好奇 RTX 3080 会为即将到来的游戏带来什么样的改进。与正常的渲染测试一样,我从一对合成开始,专门针对光线追踪性能。由于我正在寻找明显的世代改进,因此我专注于 RTX 3080 和 RTX 2080 Super Founders Edition。
我使用的测试是来自 Surgical Scalpels 的 Boundary 和来自 FYQD Studio 的 Bright Memory——这两个测试都要求极高的系统破碎机,即使启用了 DLSS。每个测试都以 4K 分辨率运行。在边界方面,RTX 3080 的性能比 RTX 2080 Super 提高了 81%。在《光明记忆》中,提升幅度为 67%。
当在实际游戏中测试改进时,我不太担心整体 FPS,而是更关心 RTX/DLSS 如何影响 FPS。为了实现这一目标,我在打开和关闭 RTX 和 DLSS(质量预设)的情况下以 4K 测试了四款游戏,并记录了多次运行的 FPS 以验证我的结果。 《德军总部:新血脉》、《地铁:离去》和《我的世界》RTX 都有内置基准测试(后者由 Nvidia 在 Portal Pioneers 世界中创建)。对于控制,我使用了一条穿过局的可重复路径,具有大量光线追踪反射,注意每次通过时都尽可能进行相同的运行,并使用 Nvidia FrameView 记录结果。
在下图中,您可以看到每个游戏的性能,首先以 FPS 为单位,然后以百分比形式显示,以便清楚地看到启用 RTX 和 DLSS 的影响。
从这张图表中可以看出,RTX 3080 的处理增强显然意味着 60+ FPS 的 4K 光线追踪游戏已成为现实。改进的光栅化以及 RT 和 Tensor 核心的增强相结合,使其在几乎所有方面都比 RTX 2080 Super 具有显着优势。但光线追踪的影响是否较小?以下是百分比形式的性能影响:
启用 RTX 和 DLSS 后,每款游戏都会出现性能下降,但 RTX 3080 的影响通常较小。《地铁:离去》 (Metro Exodus) 是个例外,其下降幅度小于 RTX 2080 Super。这种有限的采样很难得出明确的结论,但总体看来,改进的 RT 和 Tensor 核心确实特别提高了光线追踪性能。有趣的是,控制执行 更好的 在多个测试过程中,启用 RTX 和 DLSS 与禁用两者相比。
也就是说,《Wolfenstein》和《Control》的光线追踪改进都比我希望的要小,而《Metro》则相反,2080 Super 保持了轻微的优势。 RTX 3080 完全能够在 RTX 开启时以高帧率运行(Youngblood:126 FPS,控制:69 FPS,Metro:64 FPS),但需要对更广泛的游戏进行更多测试才能得出明确的结论RTX 3080 相对于 2080 Super 的整体提升百分比。
在这个样本中,《我的世界》是异常值,性能提高了 30.4%,而《控制》和《德军总部:新血脉》仅分别提高了 4.5% 和 3.1%。是否会有更多游戏的表现更接近《我的世界》或《地铁》?时间会证明一切。
DLSS
自诞生以来,DLSS(深度学习超级采样的缩写)已经取得了长足的发展。该技术利用人工智能的力量来智能地升级游戏,允许RTX显卡以较低的分辨率渲染游戏,然后使用其张量核心进行升级,理论上不会降低清晰度。例如,使用 DLSS 进行 4K 游戏可能只需要 1440p 的处理能力,从而为您提供 4K 图像的类似 1440p 的帧速率。当这项技术首次亮相时,放大图像的柔和度存在明显的问题,并且大部分兴奋感都被平息了。从那时起,Nvidia 一直在悄悄完善该技术,现在能够提供比原生 4K 更清晰的 DLSS 图形。
《德军总部:新血脉》开头的这张截图恰恰证明了这一点。仔细观察盒子上的文字和线条,以及弹药箱侧面的纹理,DLSS 提供了稍微清晰的图像,同时运行速度提高了整整 39 FPS。这是 1440p 处理时“优于 4K”的保真度。这令人印象深刻。简而言之,没有理由不使用 DLSS。
热性能和声学性能
英伟达对其新的冷却器设计进行了大肆宣传。该公司在其营销材料中指出,它的安静程度“高达”三倍,温度降低了 20 摄氏度。对于游戏和基准测试来说,该卡既酷又安静,但并没有完全达到这些数字。在我的 Lian Li Lan Cool 2 带有封闭玻璃面的机箱内,在炎热的天气里,环境温度约为 78F/26C,温度最高达到 75C;在凉爽的天气,环境温度为 70F/21C,温度最高达到 69C。这是一个相当大的差异,凸显了 RTX 3080 的散热解决方案对冷空气存在的依赖程度。相比之下,在同一温暖的日子里,RTX 2080 Super 的峰值温度为 79 摄氏度,RTX 2080 Ti 的峰值温度为 82 摄氏度。还值得注意的是,我们的测试系统将散热器安装在机箱前部,风扇通过散热器吹入。进入机箱的冷空气量比散热器安装在顶部时要少(不幸的是,Lan Cool 2 不允许这样做)。通过定制的风扇曲线和顶部安装的散热器,我相信这些温度可以进一步降低。
卡也很安静。如果没有分贝计,我无法测试确切的降噪效果,但我不止一次打开侧面板以确保一切正常运行。经过多年噪音大的库存冷却器的使用,双轴设计对噪音(即使在负载下)也进行了重大改进。
采购指南
Nvidia GeForce RTX 3080 Founders Edition 现已上市
从发布之日起,您还可以从以下供应商处购买合作伙伴卡。
留言