2025 年 1 月 28 日更新:NVIDIA RTX Blackwell GPU 架构白皮书现可在此处下载。
GeForce RTX 50 系列显卡和笔记本电脑搭载 NVIDIA Blackwell 架构,基于 NVIDIA DLSS 4 多帧生成技术实现帧率提升高达 8 倍,并利用 NVIDIA Reflex 2 将延迟降低至多 75%,同时借助 NVIDIA RTX 神经网络着色器为玩家和创作者带来更逼真的画面以及更多升级体验。
GeForce RTX 50 系列 GPU 和笔记本电脑带来全新玩法和创新性 AI 体验,助力创作者更快完成创作。回顾 NVIDIA CEO 黄仁勋发表的主题演讲,继续阅读以了解所有细节。
神经网络渲染助力计算机图形迈入新时代。通过将神经网络集成到渲染过程中,我们可以在性能、图像质量和交互性方面取得巨大飞跃,带来更逼真的沉浸式体验。
DLSS 是应用神经网络渲染的首个范例。我们使用较低分辨率的渲染帧作为神经网络的输入,该网络经过训练后可输出全分辨率的帧。如今,DLSS 已经发展到可以生成完整画面帧,并理解场景的构成,包括阴影、反射和遮蔽等,从而生成优于原生渲染的图像。支持多帧生成技术的 DLSS 4 现已发布,在整套 DLSS 技术的作用下,相比于传统图像渲染,我们可将帧率提升高达 8 倍,并提供优于原生渲染的画质。
但 DLSS 仅仅是开始。
我们已将神经网络集成到可编程着色器内,创建全新神经网络着色器。RTX 神经网络着色器将推动今后十年的图形创新。它们可用于将纹理压缩多达 7 倍,从而节省大量显存。也可以用于在游戏中创建电影级纹理,甚至更先进的光照效果。
RTX Neural Faces 提供了一种创新的方式,利用生成式 AI 提高面部图像质量。与传统渲染不同,Neural Faces 将简单的光栅化面孔及 3D 人体姿态数据作为输入,并使用实时生成式 AI 模型推理得到更加自然的面孔。
DLSS 4 提供的强大神经网络渲染功能在全新 Zorah 技术 demo 中得以体现。
NVIDIA RTX Blackwell 架构针对神经网络渲染而构建和优化。它具有极其强大的处理能力,并提供专为加速下一代神经网络渲染而设计的新引擎和功能。
装配有高达 920 亿个晶体管,Blackwell 是有史以来最强大的消费级 GPU。Blackwell 多单元流处理器 (SM) 已经过更新,具有更高的处理吞吐量,并与 Tensor Core 更紧密结合,以便优化神经网络着色器的性能。Blackwell 已由多项硬件和软件创新予以增强,进而改进着色器执行重排序。重排序逻辑的效率翻了一倍,提升的重排序速度和精度有助于提升神经网络着色器的性能。
已构建的全新 Blackwell Tensor Core 具有非常强大的 AI 算力,并支持加速处理 FP4 精度模型。借助 FP4,Blackwell Tensor Core 不仅可以更快处理模型,而且可以减少显存消耗。
为了满足下一代 DLSS 多帧生成的帧率稳定性需求,Blackwell 架构搭载了基于硬件的 Flip Metering,以提供流畅、高质量的体验。Blackwell 还采用了全新的 RT Core,旨在对大量几何图形细节进行光线追踪。
Blackwell 还采用了全新的 RT Core,旨在对大量几何图形细节进行光线追踪。RT Core 的光线三角形相交率为上一代的 2 倍并增强了压缩以减少内存占用。这样,Blackwell GPU 就能够使几何图形的光线追踪效果达到前所未有的细节水平。
Blackwell 还通过 PCIe 5.0 和 DisplayPort 2.1b UHBR20 实现了增强,从而支持高达 8K 165Hz 的显示器。
对 GeForce RTX 50 系列笔记本电脑而言,高级电源门控、低延迟休眠和加速频率切换等新型 Max-Q 技术,可实现相较于上一代产品 40% 的电池续航时间提升。
为了满足所有这些强大处理能力的需求,Blackwell 配备了世界上最快的显存 GDDR7 — 速度高达 30Gbps。Blackwell GPU 配备 G7 内存,可提供高达 1.8TB/s 的显存带宽。
GeForce RTX 5090 D 和 GeForce RTX 5080 将于1 月 30 日上市。GeForce RTX 5070 Ti 和 GeForce RTX 5070 将于 2 月上市。
GeForce RTX 5080 和 GeForce RTX 5070 显卡 NVIDIA Founders Edition 版本将面向全球发售。所有四款 GPU 的标准版和超频版可从华硕、七彩虹、耕升、影驰、技嘉、映众、万丽、微星、索泰、铭瑄、盈通等合作伙伴处购买。
得益于 Blackwell 架构的创新和 DLSS 4,GeForce RTX 5090 D 的性能高达 GeForce RTX 4090 D 的 2 倍。
凭借 32GB 的 GDDR7 显存、1792 GB/s 的总显存带宽、21760 个 CUDA 核心、680 个第五代 Tensor Core 和 170 个第四代 RT Core,作为一款性能卓越的 GeForce GPU,相比于以往的任何产品,它拥有更多硬件和更强大的功能(请点击此处查看完整规格列表)。
在游戏中,带有多帧生成功能的 DLSS 4 可帮助在“赛博朋克 2077 (Cyberpunk 2077)”、“心灵杀手 2 (Alan Wake 2)”和“黑神话:悟空 (Black Myth: Wukong)”中实现性能倍增,以便 GeForce RTX 5090 D 用户在全景光线追踪技术的支持下,以 4K 240Hz/FPS 及所有设置开启最高值的情况下畅玩游戏,进而获得绝佳体验。
在生成式 AI 应用中,在 GeForce RTX 5090 D 上采用 FP4 时,图像生成速度是在 GeForce RTX 4090 D 上采用 FP16 的 3 倍,而显存消耗减少一半。FP4 是一种更低精度量化方式,类似于文件压缩,有助于减小模型尺寸。
在 FP16 计算精度下,Black Forest Lab 的 FLUX.1 [dev] 模型需要超过 23GB 的 VRAM。在 GeForce RTX 4090 D 上,图像将在 18 秒内生成。采用 FP4 时,VRAM 占用更少,GeForce RTX 5090 D 可将图像生成时间缩短到 5 秒多一点。
GeForce RTX 5090 D 将于 1 月 30 日上市,建议零售价人民币 16499 元。
归功于 Blackwell 架构和带有多帧生成功能的 DLSS 4,GeForce RTX 5080 在游戏中的运行速度高达 GeForce RTX 4080 的两倍。全新第五代 Tensor Core、第四代 RT Core 和 16GB GDDR7 显存提供了高达 960 GB/秒的总显存带宽(相比 GeForce RTX 4080 的 717 GB/s 增加了 34%),GeForce RTX 5080 令游戏玩家和创作者实现了性能的巨大飞跃。
在采用 4K 分辨率、开启全景光线追踪和其他最高设置的情况下,GeForce RTX 5080 用户能够以高帧率畅玩“心灵杀手 2 (Alan Wake 2)”、“黑神话:悟空 (Black Myth: Wukong)”和“赛博朋克 2077 (Cyberpunk 2077)”,平均性能约为 GeForce RTX 4080 的两倍。
GeForce RTX 5080 将于 1 月 30 日上市, 建议零售价人民币 8299 元。
全新 Founders Edition 的每个方面都经过专门设计,可利用全新设计创新、液态金属散热材料 (TIM) 和独特的 3 片 PCB 提高散热能力。在全新系列显卡上市之前,请持续关注并进一步了解其设计细节。
GeForce RTX 5070 Ti 包含 16GB GDDR7 显存,具有 896 GB/s 的总显存带宽,与 GeForce RTX 4070 Ti 的 504 GB/s 相比,带宽增加了 78%。
利用 Blackwell 架构的全部功能,以及带有多帧生成的 DLSS 4 的强大功能,游戏帧率大于 GeForce RTX 4070 Ti 的两倍。在采用 2560x1440 分辨率、全景光线追踪和其他最高设置的情况下,GeForce RTX 5070 Ti 用户能够以高帧率畅玩“心灵杀手 2 (Alan Wake 2)”、“黑神话:悟空 (Black Myth: Wukong)”和“赛博朋克 2077 (Cyberpunk 2077)”。
GeForce RTX 5070 搭载 NVIDIA Blackwell 架构 12GB GDDR7 显存的强大新内核,总显存带宽为 672 GB/s,相比之下,GeForce RTX 4070 总带宽仅为 504 GB/s。
在采用 2560x1440 分辨率、开启全景光线追踪、DLSS 多帧生成和其他最高设置的情况下,GeForce RTX 5070 用户能够以高帧率畅玩“黑神话:悟空 (Black Myth: Wukong)”、“心灵杀手 2 (Alan Wake 2)”和“赛博朋克 2077 (Cyberpunk 2077)”,平均性能是 GeForce RTX 4070 的两倍。
GeForce RTX 50 系列笔记本电脑将于 3 月与大家见面。得益于全新 Blackwell Max-Q 技术创新,与前代产品相比,厚度仅为 14.9 毫米的 GeForce RTX 50 系列笔记本电脑的电池续航时间延长了 50%,性能提高了两倍。
倍增帧率畅享游戏。创作内容和完成工作流的时间缩短一半。且完成生成式 AI 任务的速度提高 2.5 倍。
Blackwell Max-Q 为最大化能效而生,可带来性能和电池续航能力的巨大飞跃。Blackwell 架构中的诸多 Max-Q 创新使这一切成为可能。
通过快速关闭 GPU 的闲置部分,高级电源门控技术可帮助显著降低功耗。
Blackwell 可显著提升进入低功耗状态的速度。低延迟休眠允许 GPU 更频繁地进入休眠状态,即使在使用 GPU 时也能降低功耗。这减少了使用电池供电下运行游戏、小语言模型 (SLM) 以及创作者和 AI 工作负载时的功耗。
加速频率切换可通过以微秒级速度自适应优化每个独特工作负载的时钟频率,从而提高性能。
GDDR7 电压优化可通过超低电压状态优化显存能效,与上一代 GDDR6 VRAM 相比,性能提升明显。
总体而言,与上一代 GeForce RTX 笔记本电脑相比,GeForce RTX 50 系列笔记本电脑的电池续航时间可延长 40%。
GeForce RTX 5090 笔记本电脑 GPU 是游戏和创作的超凡之选。10496 个 CUDA 核心、1824 AI TOPS 和 24GB GDDR7 显存,令其可提供卓越的功能和性能。笔记本电脑 GPU 有史以来最大容量的显存,可令创意和生成式 AI 工作负载受益;在笔记本电脑 GPU 中首次提供的 3 个 NVIDIA NVENC 编码器,则能令使用者以超乎想象的速度完成视频工作流。
GeForce RTX 5080 笔记本电脑 GPU 具有 7680 个 CUDA 核心、1334 AI TOPS 和 16GB GDDR7 显存,性能是 GeForce RTX 4080 笔记本电脑 GPU 的两倍。对创作者来说,显存带宽提高 2 倍将有利于进行 3D 渲染和视频编辑。
GeForce RTX 5070 系列笔记本电脑 GPU 包括两个型号。GeForce RTX 5070 Ti 笔记本电脑 GPU 具有 5888 个 CUDA 核心、992 AI TOPS 和 12GB 的 GDDR7 显存。GeForce RTX 5070 笔记本电脑 GPU 具有 4608 个 CUDA 核心、798 AI TOPS 和 8GB 的 GDDR7 显存。
GeForce RTX 5090、GeForce RTX 5080 和 GeForce RTX 5070 Ti 笔记本电脑将于 3 月上市,随后 GeForce RTX 5070 笔记本电脑将于 4 月份上市。全球领先的 OEM 厂商,包括宏碁、华硕、戴尔、惠普、联想、机械革命、微星和雷蛇等,都将发布全新的笔记本电脑。敬请关注其网站,了解这些合作伙伴正在开发的 GeForce RTX 50 系列笔记本电脑的更多详情。
得益于 Blackwell 架构,GeForce RTX 50 系列用户将获得突破性的性能、更快的游戏响应速度、电影级视觉效果以及进一步提升游戏和应用性能的 AI 应用。
NVIDIA DLSS 是一套由 GeForce RTX Tensor Core 提供支持的神经网络渲染技术,不仅能提高帧率,还可同时提供清晰锐利的高质量图像,效果与原生分辨率渲染媲美。现已有超过 700 款游戏和应用支持 RTX 技术。
在 CES 2025,我们正式发布了 DLSS 4,集成了适用于 GeForce RTX 50 系列 GPU 的多帧生成技术,这代表了 DLSS 技术的又一次进步。DLSS 多帧生成技术可为每个传统渲染帧生成多达三帧,配合整套 DLSS 技术,最高可将帧率提升至传统图像渲染的 8 倍。GeForce RTX 5090 D 显卡的这一显著性能改进有助于实现令人惊艳的 4K 240 FPS 全景光线追踪游戏体验。
在“赛博朋克 2077 (Cyberpunk 2077)”的这一场景中,带有多帧生成功能的 DLSS 4 在 GeForce RTX 5090 D 上可将性能提升至传统图像渲染的 8 倍以上,还将 PC 延迟减半,在进一步增强画质的同时提升了游戏的响应速度。
DLSS 4 还提供了自 2020 年 DLSS 2.0 发布以来最重磅的升级:
现在,DLRR 光线重建、DLSR 超分辨率和 DLAA 已经由 Transformer 模型提供支持,这意味着我们推出了图形领域首个实时 Transformer 应用场景。Transformer 正是 ChatGPT,Flux 和 Gemini 等前沿 AI 模型使用的架构。DLSS Transformer 模型可增强画质,提升稳定性,减少伪影并提供更多的细节表现。
观看 NVIDIA 的 Bryan Catanzaro 和 Edward Liu 的 DLSS 4 讲解视频
请参阅 DLSS 4 公告文章了解更多详情。
在竞技游戏中,几毫秒的输入延迟可能就决定了胜负。
2020 年,我们发布了创新技术 NVIDIA Reflex,将热门竞技游戏的 PC 延迟平均降低了 50%。NVIDIA Reflex 通过同步 CPU 和 GPU 的工作,让玩家操作在游戏中反应更快,在多人游戏中为玩家带来制胜优势,并提高单人游戏的响应能力。
在 CES 2025 上,我们推出了 NVIDIA Reflex 2,可将 PC 延迟降低高达 75%。Reflex 2 将 Reflex 低延迟模式与全新 Frame Warp 技术相结合,在将渲染帧发送至显示器前,根据最新的鼠标输入信号对其进行更新,从而降低游戏延迟。
请参阅 NVIDIA Reflex 2 公告文章了解更多详情。
归功于面向创作者的全新 NVIDIA Studio 工具和功能以及更快的硬件,GeForce RTX 50 系列改进了创意工作流。
添加了对 4:2:2 专业级色彩格式的编解码硬件支持,相比于软件编码器,编码速度显著提高了 11 倍。
第九代 NVENC 视频编码器将 HEVC 和 AV1 编码质量提高了 5%,全新 AV1 Ultra Quality 模式将编码效率额外提高了 5%。第六代 NVIDIA 视频解码器 NVDEC 能够同步解码和播放多达八个 4K60 4:2:2 视频流。
主播将获得两项全新 AI 升级:来自 Streamlabs 的 AI 智能体 — 该智能流媒体助手由 NVIDIA ACE 和 Inworld AI 提供支持,能够助您融入直播,协助您制作流媒体内容或解决任何技术问题。以及一次全新 NVIDIA Broadcast 升级:提供 2 个新特效,音棚音效 (Studio Voice) 帮助提高麦克风音质,虚拟补光 (Virtual Key Light) 则利用 AI 来为您提供面部补光。
DLSS 多帧生成功能进一步提升了创意应用中的视口帧率 — GeForce RTX 50 系列 GPU 与新一代 RT Core 搭配使用,在 D5 Render 等应用中编辑 3D 场景时,相比于上一代产品可实现 2 倍的性能提升。
NVIDIA RTX Remix 将在近期支持 RTX 神经网络渲染技术和更多功能。
RTX Video 可通过消除压缩瑕疵并锐化边缘来提升视频画质。同时,将标准动态范围 (SDR) 视频转换为生动的高动态范围 (HDR) 视频的 RTX Video HDR 功能也得到更新,可将 GPU 占用率降低 30%。RTX Video 超分辨率现在也可以提升 HDR10 视频内容的质量。
请参阅全新 GeForce RTX 50 系列 NVIDIA Studio 博客了解更多详情。
NVIDIA ACE 是一套数字人技术,借助生成式 AI 使游戏角色和数字助理栩栩如生。由 GeForce RTX AI PC 和笔记本电脑提供支持,ACE 角色可利用 AI,像真人玩家一样进行感知、制定规划并采取行动。与 AI 队友合作畅玩游戏,并与不断学习并适应玩家游戏风格的敌人作战,同时与拥有自主意识的 NPC (他们在持续运行的游戏世界中受自己的动机和目标驱动) 互动。
请通过 NVIDIA ACE 游戏文章,了解如何在 inZOI、“传奇 5 (MIR5)”、"永劫无间手游 PC 版 (NARAKA: BLADEPOINT MOBILE PC VERSION)"、“绝地求生 (PUBG: BATTLEGROUNDS)”等游戏中利用 NVIDIA ACE 技术创建拥有自主意识的 AI 队友、Boss 等。
为了向 RTX 发烧友和开发者展示使用 NIM 微服务构建 AI 智能体和助手的方法,NVIDIA 今天首度公开 Project R2X。这是一个具有视觉形象的 PC 虚拟人物,它可以让用户需要的信息触手可及、为桌面应用和视频会议提供协助、阅读和汇总文档等等。
R2X 可以通过 CrewAI、Flowise AI 和 Langflow 等开发者框架连接到 OpenAI 的 ChatGPT 和 xAI 的 Grok 等云端 AI 服务,以及 NIM 微服务和 AI Blueprint,例如 PDF 检索程序或其他 LLM。
凭借相较于上一代 GPU 的两倍性能提升、笔记本电脑电池续航时间延长 40% 以及一整套神经网络渲染功能,GeForce RTX 50 系列产品将实现性能飞跃。利用 DLSS 多帧生成、FP4 和其他增强功能,在现有游戏和应用中的性能将获得显著提升。如 Zorah 技术演示所示,在不远的将来,用户即可充分利用 RTX 神经网络渲染功能畅玩游戏,并以影片级视觉效果进行创作。
请关注 GeForce.cn 上有关 GeForce RTX 50 系列的最新消息。随着新一代 GPU 和笔记本电脑上市日期的临近,我们会发布更多信息以及即将发布的游戏和技术的所有公告。
与此同时,敬请查看其他 GeForce RTX 50 系列公告,了解我们如何进一步提升游戏和应用体验,并推出助力 PC 行业发展的创新技术和产品。