GeForce RTX 40 系列关注焦点:答疑解惑

在 GeForce RTX 40 系列发布之后,我们邀请了七位 NVIDIA 产品经理,针对玩家关注的焦点问题举行了相关问答活动。虽然不能解答全体玩家的所有问题,但我们的专家依然对最备受关注的问题进行了解答。

GeForce RTX 40 系列

问:如果 RTX 4080 16 GB 和 12 GB 显卡拥有并不相同的 CUDA Core 核心数量,甚至是不同的芯片,那么它们为何都被称为“RTX 4080”?

RTX 4080 16GB 和 12GB 的命名延续了上一代 两个 RTX 3080 不同版本,乃至之前其它类似产品的命名方式。RTX 4080 提供两种规格,一种具有 16GB 显存,另一种具有 12GB 显存,即一个产品名称,两种规格。

4080 12GB 是一款出色的 GPU,性能超过了上一代旗舰产品 RTX 3090 Ti,凭借 DLSS 3的支持,其性能甚至能够达到 RTX 3080 Ti 性能的 3 倍左右,完全有理由相信它是一款优秀的 80 级 GPU。我们了解许多游戏玩家可能想要一个更高规格的选择,而 RTX 4080 16GB 恰好能提供更大的显存和更高的性能。两个版本的包装、产品细节和销售推广都将会明显不同,因此游戏玩家和创作者可以轻松选择更适合自己的 GPU。

问:如果不开启 DLSS 帧生成功能,RTX 40 系列的性能与 30 系列相比如何?

您可以在此查阅有关性能的更多资讯。

此图表显示的是已开启 DLSS(如果支持)的情况,但图表中有一些游戏(如“全境封锁 2 [Division 2]”和“刺客信条:英灵殿 [Assassin's Creed Valhalla]”)由于不支持 DLSS,因此您可以看到在这类不支持 DLSS 的游戏中,与 RTX 30 系列 旗舰级 GPU 的性能比较情况。

问:有关视觉效果和游戏的内容非常多,但我对 CUDA 功能更感兴趣。与定位相同的 RTX 30xx 型号相比,核心数量减少了,但支持的功能得到增强。在现有工作流中,RTX 40xx 上的 CUDA Core 核心的速度/性能/效率提升了多少?

CUDA 应用工作流可能比游戏更加多样化。一般而言,核心频率的不断提升使得着色器性能也随之增强,提升幅度从 30% 到 120% 不等。显存访问模式更具挑战性的 CUDA 应用也可以从更大的二级缓存中受益。对于创作者工作流,GeForce RTX 40 系列在离线渲染应用(如 Blender 或 V-Ray)中的速度可提升高达 2 倍,并且与 DLSS 3 搭配使用时,在实时渲染应用(如 Omniverse、虚幻引擎或 Unity)中的速度可提升高达 4 倍。性能更强的同时,其功耗能够与上一代产品相当甚至更低。

问:GeForce RTX 4090、RTX 4080 (16GB) 和 RTX 4080 (12GB) 需要搭配什么类型的电源?

RTX 4090 采用全新的 PCIe 5.0 电源接口,只需一根线缆即可为显卡供电。我们预计将于 10 月推出支持此接口的电源。不过,4090 将附带一个电源转接器,使您可以将电源与主流的 8 针 PCIe 接口配合使用。RTX 4080 使用 PCIe 5.0 电源接口。

RTX 4080 使用 PCIe 5.0 电源接口。它配备了一个支持 PCIe 8 针接口的电源转接器。

此外,目前适用于 RTX 30 系列的 12 针线缆和电源转接器与 RTX 40 系列显卡不兼容。

问:为什么规格表上没有列出 DisplayPort 2.0?

当前的 DisplayPort 1.4 标准能够支持 60Hz 刷新率的 8K 显示器。而且,消费级游戏显示器在相当时期内都不会提供对 DisplayPort 2.0 的支持。

问:谁能解读一下这些性能评测与游戏之间的关联吗? 2 到 4 倍的性能提升看起来近乎史无前例。通常,GPU 的逐代性能提升幅度为 30% 到 50%。评测数据是否可以证明这些显卡能够使游戏性能“至少”翻倍?

RTX 4090 性能之所以能提升高达 2-4 倍,源于软件与硬件增强功能相结合。我们对RTX架构三种不同类型的处理核心都进行了升级,包括着色器核心、RT Core 和 Tensor Core。RTX 4090 与我们全新的 DLSS 3 AI 帧生成技术相结合,与 RTX 3090 Ti 相比,在新的游戏和创意应用中可实现性能翻倍。如果在 GPU 上加载工作负载更大的基于新一代技术的内容,我们会发现性能提升甚至能高达 4 倍。这些并不是最小性能提升,而是您在计算密集度更高的游戏和应用中有望实现的性能提升。

您可以在此查阅有关性能的更多咨询。

NVIDIA DLSS 3

问:DLSS 2.X 是否会在未来的游戏中持续得到改进和支持?

DLSS 3 包含 3 项技术:DLSS 帧生成、DLSS 超分辨率(也称为 DLSS 2)和 NVIDIA Reflex。

DLSS 帧生成功能使用 高速的 RTX 40 系列光流加速器计算用于 AI 网络的运动流,然后在第 4 代 Tensor Core 上执行网络。要支持以前的 GPU 架构,需要对光流算法和 AI 模型进行进一步的创新和优化。

当然,现有的硬件仍然将会支持 DLSS 超分辨率和 NVIDIA Reflex ,因此目前的 GeForce 游戏玩家和创作者都将从集成 DLSS 3 的游戏中受益。我们会继续研究并训练用于 DLSS 超分辨率的 AI,并将像 DLSS 首次发布以来一样,为所有 RTX 客户提供模型更新。

DLSS 3 子功能

GPU 硬件支持

DLSS 帧生成

GeForce RTX 40 系列 GPU

DLSS 超分辨率(也称为 DLSS 2)

GeForce RTX 20/30/40 系列 GPU

NVIDIA Reflex

GeForce 900 系列和新的 GPU

问:DLSS 3.0 看起来很棒,在技术层面上给人留下了深刻印象。是否需要进行引擎层面的更新才能体验到 DLSS 3.0 相对于 2.0 的改进之处?或者说,是否可以在已支持 DLSS 2.0 的游戏中轻松实现 DLSS 3.0,而无需进行大量开发工作?

更轻便简洁的集成方式,一直是 DLSS 3 的设计目标。随着超过 35 款游戏和应用即将推出,DLSS 3已成为英伟达普及速度最快的技术之一。首批支持 DLSS 3 的游戏将于 10 月推出。

DLSS 3 利用与 DLSS 2 和 NVIDIA Reflex 相同的集成点,通过 DLSS 3 Streamline 插件即可轻松升级现有 SDK。

DLSS 3 也即将应用于全球最热门的游戏引擎,包括 Unity、虚幻引擎和寒霜引擎,使得基于这些引擎的游戏也能够轻松切换到 DLSS 3。

问:光流如何融入模型?如果 DLSS 2 是对下一帧的空间重建,这是否意味着我们对前面的多个帧进行时序重建?此外,它能否实现低于 25% 的像素渲染(DLSS 性能模式)?

DLSS 3 中有两个 AI 模型:DLSS 超分辨率(也称为 DLSS 2)和 DLSS 帧生成。DLSS 超分辨率通过渲染更少的像素,然后使用 AI 构建分辨率更高的清晰图像来提高帧率。DLSS 帧生成功能会通过分析 GeForce RTX 40 系列 GPU 中的光流加速器的连续帧和运动数据来生成额外的高质量帧,从而提高性能,并保持出色的画质和响应速度。启用 DLSS 3 后,第一帧首先由 DLSS 超分辨率重建,后续帧则由 DLSS 帧生成负责重建。总体而言,DLSS 3能够重建总显示像素数的 7/8。有关详情,请单击此处

NVIDIA RTX Remix & RTX 版“传送门 (Portal)”

问:在今天的活动中,RTX 版“传送门 (Portal)”是我最喜爱的部分。我是在旧版游戏中实现 RTX 的铁杆粉丝。未来还会有其他类似的项目吗?

我们很高兴大家喜欢 RTX 版“传送门 (Portal)”!NVIDIA RTX Remix 是一款用于开发 RTX 版“传送门 (Portal)”的工具套件,它将免费提供给游戏社区的发烧玩家们重新制作类似的游戏--或者继续在 RTX 版“传送门 (Portal)”上深度重构游戏。我们很高兴看到社区即将推出的一些列作品!目前,我们还没有关于 NVIDIA Lightspeed Studio 项目的进一步消息宣布。

问:RTX Remix 是否仅支持 40xx 显卡上?

不是。除性能外,使用 RTX Remix(包括 RTX 版“传送门 [Portal]”)创建的 RTX 模组有望在支持 Vulkan 光线追踪的 GPU 上运行。运行 RTX Remix 创作者工具套件,需要显存不少于 8GB 的 RTX GPU 支持。

而支持 DLSS 3 的 RTX 40 系列显卡将是完美体验 RTX Remix 和 RTX 模组的理想产品。在 RTX Remix 公测版即将发布的时候,将会提供更多有关 GPU 的推荐配置信息。

问:在“上古卷轴 3:晨风 (The Elder Scrolls III:Morrowind)”的 RTX Remix 展示中,由AI和创作者各自完成的内容分别有哪些?

鉴于大家对此问题有不少疑问,请允许我来解答一下。RTX Remix 包含 AI 纹理工具,可将纹理放大 4 倍,并将其转换为基于物理的材质。当我们展示一个由“AI 纹理工具”简单处理过的场景时,我们都会将其标记为经过了“AI 增强”。我们认为,AI 虽然能够为游戏改装者 (Modder) 重制游戏提供一个良好基础。但是,为了让重制游戏实现 RTX On 画质,我们鼓励游戏改装者更多的依靠自己来构建更关键的素材,以获得更理想的艺术视觉效果。

在 RTX 版“传送门 (Portal)”和 “上古卷轴 3:晨风 (The Elder Scrolls III:Morrowind)”中,NVIDIA 团队利用与 Omniverse 连接的创作者应用生态系统(如 Adobe Substance、Autodesk Maya 和 Blender)进一步增强了大部分素材。在我们的预告片中,为了更好的提示,经过重制的场景都会被标记"RTX On ",其中包括光线追踪、RT-ready自定义素材以及DLSS 3。如要了解我们如何在“晨风 (Morrowind)”中添加 具体的RTX 技术,请观看我们的解说视频。

 

问:对于游戏 MOD 领域而言,NVIDIA Remix 无疑是个好消息,但是它的适用性会有多广?是支持绝大多数游戏,还是仅局限于部分特定的游戏?

初步规划是先为使用固定图形渲染管线的 DirectX 8 和 9 游戏提供支持。游戏兼容性可能会因游戏而异,更多信息将在更接近公测版发布时提供。请务必告诉我们,您对改装哪些 DirectX 8 和 9 游戏特别感兴趣并为之兴奋!

问:如何将改装好的全新场景置入游戏中?所有这些新的物体,光源。它们需要以某种方式与游戏引擎/NPC/玩家角色交互,但如何实现呢?

游戏引擎会乘 DirectX 运行时发出命令,这些命令指示 GPU 正确渲染相应的 NPC/玩家角色。RTX Remix 会在这些命令被 GPU 接收之前截取它们,并根据创作者的要求进行更改,如 RTX Remix 工具套件中所示的那样。

问:RTX Remix 是否会支持 DLSS 2 和 FSR 2.1,还是说仅支持 DLSS 3?

目前,RTX Remix 支持 DLSS 3 功能,其中就包括了 DLSS 帧生成、DLSS 超分辨率(也称为 DLSS 2)和 NVIDIA Reflex。

NVIDIA Reflex

问:原生性能如何?DLSS 和光线追踪技术在游戏中的实际表现确实不错,但作为一名竞技类 FPS 玩家,我更关心原生性能。

这一代产品的原生性能也得到了大幅提升!RTX 40 系列 GPU 能够支持以超过 360 FPS 的帧率体验 1440p 竞技游戏。在 1440p 分辨率下,我甚至能以超过 400 FPS 的帧率玩“无畏契约 (Valorant)”。如需了解详情,请参阅今天发布的文章

问:几周前,我的一位好友告诉我,NVIDIA Reflex 即使是老款 GPU 也能支持该功能,是真的吗?老款 GPU 获得的提升明显吗?

老款 GPU 往往具有更低的 FPS 和更高的延迟, NVIDIA Reflex 可以帮助减少更多的延迟。

例如(不是真实数据):

  • 老款 GPU - Reflex 关闭 50 毫秒 -> Reflex 开启 30 毫秒
  • 全新 GPU – Reflex 关闭 25 毫秒 -> Reflex 开启 18 毫秒  

新老 GPU 均可从 NVIDIA Reflex 中受益。在老款 GPU 上,由于基础延迟更高,因此带来的收益百分比甚至更高。

NVIDIA Broadcast, NVIDIA Studio & NVENC

问:与更加传统的 x264 相比,使用 NVIDIA NVENC 能带来哪些提升?

x264 是在 CPU 上运行的软件编码器,而 NVENC 是在 NVIDIA GPU 上使用专用核心的硬件编码器。x264 将占用部分 CPU 负载,挤占了游戏或其他应用可使用的 CPU 资源。NVENC 在 GPU 专属的硬件上运行,这样 CPU 和 GPU 可以专注于渲染游戏和应用。因此,使用 NVENC 可以更大限度地利用硬件以实现更高的 FPS。

除此之外,像 AV1 这样的下一代编解码器会消耗大量资源,主流 CPU 基本无法良好运行。但凭借 GeForce RTX 40 系列中的 NVENC,您可以无缝编码规格高达 8K60 的 AV1 格式内容。

问:NVDEC 有升级吗?仍然需要依靠 M1 或 Quicksync 进行 10 bit 422 格式解码。

GeForce RTX 40 系列使用与 RTX 30 系列 (第 5 代 NVDEC)相同的 NVIDIA 解码器,不支持 10 bit 4:2:2 格式解码。

问:ShadowPlay 能否从 NVENC 改进和新增的 AV1 编码中受益?

ShadowPlay 也随之更新,现在可利用 GeForce RTX 40 系列双编码器,用 HEVC 格式录制高达 8K60 HDR 的画面。ShadowPlay 目前还不支持 AV1格式录制。

问:对于 Blender 和其他 3D 应用,性能提升幅度如何?

GeForce RTX 40 系列在离线渲染器(如 Chaos V-Ray 或 Blender)中的速度可逐代提升高达 2 倍,并且与 DLSS 3 搭配使用时,在实时渲染器(如 Omniverse、虚幻引擎或 Unity)中的速度可提升高达 4 倍。

了解更多关于 GeForce RTX 40 系列显卡和我们在 GeForce Beyond 主题演讲中发布的其他内容,请访问 GeForce.cn