NVIDIA Llama Nemotron

使用先进的开放式推理基础模型构建 AI 智能体平台。

探索模型

新闻稿 | 面向开发者

概述
优势
模型
技术
采用者
资源
后续步骤

概述

概述
优势
模型
技术
采用者
资源
后续步骤

概述

什么是 Llama Nemotron？

NVIDIA Llama Nemotron 是一套先进的模型，在推理和多种代理式 AI 任务方面表现出色。这些模型针对从数据中心到个人电脑等各类平台进行了优化，在研究生水平的科学推理、高等数学运算、编程、指令执行以及工具调用等方面表现卓越。

这些模型能够打开和关闭推理功能，从而在任务不需要深度思考时降低推理成本。

NVIDIA 推出用于构建 AI Agent 平台的开放式推理模型系列

内置推理模型系列的新 Llama Nemotron 经过 NVIDIA 的后训练，为代理式 AI 做好业务准备。

了解详情

使用开放式 NVIDIA Llama Nemotron 模型为企业构建先进的 AI 推理 Agents

了解 NVIDIA 是如何基于 Llama 开源模型开发出具备推理能力的 Llama Nemotron 模型家族的，以及又是如何利用 DeepSeek-R1 的推理专业技术对其进行后期训练的。

了解详情

优势

Llama Nemotron 为代理式 AI 带来了什么？

高准确率

Llama Nemotron 开放模型系列基于 Llama，利用 Llama 卓越的知识和经 NVIDIA 审查的 DeepSeek-R1 推理能力进行后训练，在领先基准测试中实现了最高准确性。

高计算效率

该系列已针对低延迟和最高吞吐量进行了优化，降低了生产中运行模型的成本，并且提供了打开或关闭推理的选项，进一步缩短了查询计算时间。

具备商业可行性

NVIDIA 的后训练数据和优化技术可确保为开发者和企业提供强大、透明、灵活的模型。

透明、安全

这些模型保留了 Llama 的互联网级知识，可部署在用户的安全 GPU 加速平台上。

模型

适用于不同工作负载的推理模型

从轻量级推理到复杂决策涉及的长期思考，Llama Nemotron 系列可满足企业 AI 智能体的多样化需求。

Nano

为 PC 和边缘设备提供出色的准确性

Super

利用最强推理能力处理棘手的任务，并且针对数据中心的规模进行优化

Ultra

为复杂系统提供最高的代理准确性，并且针对多 GPU 数据中心规模进行优化

查看所有 Llama Nemotron 模型

技术

代理式 AI 的基础模组

开始使用 NVIDIA NeMo™ 构建 AI 代理，以实现自定义代理式 AI，使用 NVIDIA NIM™ 实现快速的企业级部署，并使用 NVIDIA Blueprints 加速开发自定义参考工作流。

NVIDIA NIM

加快部署性能经优化的生成式 AI 模型。
利用稳定而安全的 API 运行业务应用，并享受企业级支持。

NIM 入门

NVIDIA Blueprints

快速开始使用生成式 AI 用例的参考应用，例如数字人和多模态检索增强生成 (RAG)。
借助 Blueprints 中包含的合作伙伴微服务、一个或多个 AI 智能体、参考代码、定制文档，以及用于部署的 Helm 图表加速开发。

Blueprints 入门

NVIDIA NeMo

构建、定制并部署生成式 AI 和代理式 AI。
交付企业就绪大语言模型 (LLM)，提供精确的数据管护、前沿定制、可扩展的数据采集、RAG 和加速性能。
轻松构建数据飞轮，并利用最新信息持续优化 AI 智能体。

NeMo 入门

启动选项

Llama Nemotron 入门方法

开始免费原型设计

开始使用由 NVIDIA DGX Cloud 提供支持的、简单易用的 NIM API 端点。

访问全面加速的 AI 基础设施。
确保数据不用于模型训练。
无预付，仅需简单的构建、测试和部署路径。

立即体验

联系我们

与 NVIDIA AI 专家交流，了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持，将试运行的生成式 AI 投入生产。

了解您的生成式 AI 用例。
讨论您的技术要求。
根据您的目标和要求调整 NVIDIA AI 解决方案。

联系销售顾问

采用者

使用 Llama Nemotron 的企业

资源

了解 Llama Nemotron 的最新信息

NVIDIA Llama Nemotron with reasoning family of models

NVIDIA 推出用于构建 AI Agent 平台的开放式推理模型系列

该系列经过 NVIDIA 的后训练，在 Llama 的基础上开发而成，并通过 DeepSeek-R1 进行模型蒸馏，探索这个系列并了解这些模型如何满足部署就绪型 AI 智能体的业务需求。

了解详情

使用开放式 NVIDIA Llama Nemotron 模型构建先进的 AI 推理 Agents

了解 NVIDIA 是如何基于 Llama 开源模型开发出具备推理能力的 Llama Nemotron 模型家族的，以及又是如何利用 DeepSeek-R1 的推理专业技术对其进行后期训练的。

了解详情

构建定制推理模型，实现高级代理式 AI 自主性

了解如何利用各种技术构建或定制推理模型，包括蒸馏和强化学习。

观看会议

后续步骤

准备好开始了吗？

使用合适的工具和技术，将 Llama Nemotron 模型从开发阶段向生产阶段推进。

开始使用

联系我们

与 NVIDIA 产品专家交流，了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持从试运行阶段向生产阶段推进。

联系我们

及时了解 NVIDIA 代理式 AI 新闻

获取最新的代理式 AI 新闻、技术、突破等信息，直接发送到您的收件箱。

随时了解最新情况