AI 智能体

AI 智能体是先进的 AI 系统，旨在根据高级目标自主进行推理，制定计划并执行复杂任务。

什么是 AI 智能体？

AI 智能体是新兴的数字化劳动力，既为我们服务，也与我们协作。它们代表人工智能领域的下一次演进，即从简单自动化向能够管理复杂工作流的自主系统过渡。这些智能体不仅可以自动执行耗时的重复性任务，而且可以充当智能个人助手，帮助个人和企业组织提高运营效率。

与遵循基本“请求和响应”框架的传统生成式 AI 模型不同，AI 智能体还能编排资源，与其他智能体协作，并使用各种工具，如大语言模型 (LLM)、检索增强生成 (RAG)、向量数据库、API、框架以及 Python 等高级编程语言，从而实现超越。

这些系统通常被称为“代理式 AI”或“LLM 智能体”，由于能够通过迭代规划和决策制定来实现目标，因此在市场上脱颖而出。例如，用于构建网站的 AI 智能体可以自主管理布局设计、HTML 和 CSS 代码编写、后端流程连接、内容生成和调试等任务，同时尽可能减少人工输入。

代理式 AI 工作流的工作原理

AI 智能体包含哪些组件？

要了解 AI 智能体的工作原理，分析其核心组件至关重要。这些组件协同工作，帮助智能体高效进行推理，制定计划并执行任务：

LLM：大语言模型 (LLM) 是 AI 智能体的“大脑”，负责协调决策制定。LLM 通过任务进行推理、制定行动计划，选择合适的工具，并管理对必要数据的访问权限，从而实现目标。作为智能体的核心，它负责定义和编排智能体的总体目标。
记忆模组：AI 智能体依靠记忆来维护上下文，并可以根据正在进行的任务或历史任务进行调整：
- 短期记忆：跟踪智能体的“思维链”和最近的操作，确保在当前工作流期间保留上下文。
- 长期记忆：保留历史交互情况和相关信息，以便随着时间推移更深入地理解上下文并改进决策制定过程。
规划模组：利用规划模组，AI 智能体可将复杂任务分解为可操作的步骤：
- 无反馈：使用“思维链”或“思维树”等结构化技术，将任务分解为可管理的步骤。
- 有反馈：整合 ReAct、Reflexion 或人机回圈反馈等迭代改进方法，以优化策略和结果。
工具：AI 智能体本身可以用作工具，但也可以通过集成外部系统来扩展功能，例如：
- API：以编程方式访问实时数据或执行操作。
- 数据库和 RAG 工作流：检索相关信息，确保知识库准确无误。
- 其他 AI 模型：与其他模型协作，执行专业任务。

AI 智能体的工作原理是什么？

AI 智能体可将核心组件无缝整合在一起，处理复杂的任务。下面的示例说明了这些组件如何协同工作，以响应特定用户请求。

提示词示例：分析我们的最新季度销售数据，然后提供一个图表。

组件协同工作，对请求做出响应

分步流程

第 1 步：用户或机器提出请求

用户甚至是另一个智能体或系统请求分析销售数据并提供视觉表示，启动了智能体工作流。智能体处理此输入，并将其分解为可操作的步骤。

第 2 步：LLM：理解任务

LLM 充当 AI 智能体的大脑。它解读用户的提示词，以理解任务要求，例如：

从数据库中检索数据。
执行数据分析。
创建可视化图表。

LLM 确定：

已有哪些信息。
需要其他哪些数据或工具。
完成任务的分步计划。

第 3 步：规划模组：任务分解

规划模组会将任务划分解为具体的操作：

提取：从公司数据库中检索最新销售数据。
分析：应用适当的算法来识别趋势并获取洞察。
可视化：生成显示结果的图表。

第 4 步：记忆模组：提供上下文

记忆模组确保保留上下文，以便高效执行任务：

短期记忆：跟踪当前工作流的上下文（例如上个季度请求的类似任务），以简化流程。
长期记忆：保留历史数据，如数据库位置或首选分析方法，以便更深入地理解上下文。

第 5 步：工具集成：执行任务

智能体核心通过编排外部工具来完成每个步骤：

API：检索原始销售数据。
机器学习算法：分析数据以了解趋势和模式。
代码解译器：根据分析结果生成图表。

第 6 步：推理和反思：改进结果

在整个过程中，智能体会运用推理来优化工作流并提高准确性。这包括：

评估每项操作的有效性。
确保高效利用工具和资源。
从用户反馈中学习，以改进未来任务。

例如，如果生成的图表需要改进，智能体会调整方法，以便在后续工作流中提供更好的结果。

为什么推理至关重要

推理层是代理式 AI 的一个决定性特征，可帮助智能体思考如何实现目标。通过将 LLM 功能与 API、编排软件和上下文记忆等工具相结合，推理可助力智能体准确高效地应对复杂环境。由于具有这种适应性，AI 智能体成为一类至关重要的工具，可帮助自动执行和优化复杂工作流。

有哪些不同类型的 AI 智能体框架？

AI 智能体可以直接使用 Python 编写，用于执行简单工作流和实验的智能体尤其如此。迁移到更复杂的工作流或生产环境时，遥测、日志记录和评估变得至关重要，此时智能体框架将发挥重大作用。AI 智能体框架为专用开发平台或库，旨在简化 AI 智能体的构建、部署和管理流程。这些框架消除了构建智能体系统的过程中存在的大部分底层复杂问题，使开发者能够专注于特定的应用和智能体行为，而非实施的技术细节。

在选择 AI 智能体框架时，必须考虑诸多因素，例如：

多智能体协作：项目是否需要多个智能体协同工作？
项目复杂性：框架适合简单的任务还是复杂的工作流？
数据处理：框架是否支持必要的数据集成和检索？
定制需求：定制智能体行为需要多大的灵活性？
LLM 侧重点：框架是否会优先与大语言模型进行协作？

鉴于这些要求，一系列框架应运而生，可满足不同用例和复杂程度的需求。

有多种方法可用于实施 AI 智能体，例如，引入自己的 Python、LangChain 和 Llama 堆栈。

有哪些类型的 AI 智能体？

AI 智能体可以根据复杂程度、决策制定过程以及对环境的适应程度来分类。下面列出了主要的 AI 智能体类型，涵盖了简单的系统到高度智能化的自适应框架：

智能体的类型	主要特征	用例示例
简单反射型	根据当前感知和预定义规则执行操作没有记忆或适应能力	恒温器根据传感器输入调节温度
基于模型的反射型	保留短期记忆或由规则指导的环境操作模型	导航系统根据交通状况更新路线
目标型	根据当前感知和预定义规则执行操作没有记忆或适应能力	送货机器人优化前往目的地的路线
分层式	多层系统通过更高级别的智能体来管理专用智能体	工厂自动化系统与监督者和专业机器人协同工作
学习型	通过反馈和经验进行学习和调整使用学习组件	AI 推荐系统随着时间推移而改进建议
多智能体系统 (MAS)	与其他智能体协作实现共同目标在协调系统中运行	无人机队群协作投递包裹
效用型	通过最大限度地增加每次操作的效用或奖励来优化结果	动态定价算法根据市场条件调整费率

什么是 AI 智能体编排？

编排类型	说明	优势	挑战	用例示例
集中式	单一监督者智能体协调任务、数据流和决策制定	控制逻辑清晰简化管理一致决策	潜在瓶颈对动态系统的适应性较差	客户关系管理 (CRM)
去中心化	每个智能体自主运行，与其他智能体共享信息	高度灵活可适应动态环境	需要复杂的通信协议复杂程度更高	无人机蜂群用于实时送货
联合式	多个智能体系统使用共享协议跨企业组织进行协作	便于跨系统协作充分利用系统优势	高度依赖互操作性和共享标准	企业间的供应链协作
分层式	分层结构中的高级别智能体对低级别智能体进行监督	兼顾灵活性与监督能力复杂系统的理想选择	跨层协调可能较为复杂可能存在依赖性延迟	采用分层控制的工业自动化

AI 智能体编排指以下过程：使通常独立运行的多个智能体或工具协同工作以实现共同目标。这种协调有利于系统高效管理和执行更复杂的任务。

可以将编排视为多智能体系统控制框架。编排为在多智能体系统中实现可扩展性、高效率和适应性奠定了基础。通过让多个智能体高效协作并共享资源，编排可为以下方面提供支持：

动态解决问题：根据不断变化的条件或意外挑战做出调整。
提高资源利用率：优化智能体访问和使用工具以及数据的方式。
增强系统可靠性：减少冲突，确保结果一致。

由于具有这些优势，编排对物流、自主系统、网络安全和企业自动化等行业至关重要。在这些行业，无缝多智能体协作是成功的关键要素。

AI 智能体与 AI 助手有什么区别？

特性	AI 助手	AI 智能体
目的	根据用户命令简化任务	自主完成复杂的多步骤目标驱动型任务
任务复杂程度	低到中	中到高
交互性	反应式	主动式
自主性	低：依赖人工指导	高：独立基于规划和推理
学习能力	低：最小（如果有）	高：从交互中学习，随着时间推移进行调整
集成度	高：但仅限于特定应用	广泛性：包含 API、数据库和工具

AI 智能体和 AI 助手在功能、自主程度以及可处理任务的复杂程度上存在巨大差异。

AI 助手是传统 AI 聊天机器人的进化版本。它们利用自然语言处理 (NLP) 理解文本或语音形式的用户查询，然后根据直接人工指令执行任务。这些系统（如 Apple 的 Siri、Amazon 的 Alexa 或 Google Assistant）在处理预定义任务或响应特定命令方面表现出色。

AI 智能体是一种更先进的 AI，其功能远超 AI 助手。它们利用规划、推理和上下文记忆来自主处理复杂的开放式任务。AI 智能体可以执行迭代工作流，使用一系列工具，并根据反馈和之前的交互情况做出调整。

AI 智能体有哪些用例？

总的来说，AI 智能体的潜在用例不可胜数。部署 AI 智能体依赖想象力和专业知识，涵盖了生成和分发内容等简单用例，以及编排企业软件和数据库功能等复杂用例。

任务执行

任务执行智能体（也可称为“API 智能体”或“执行智能体”）可以使用一组预定义执行功能来完成用户请求的任务。

示例：“为我写一篇社交媒体帖子来推销我们的最新产品，务必提到它正在特价销售，现在推出了绿色款。”

构建您的首个用于创作数字内容的 AI 智能体

工作流优化

用于特定应用的 AI 智能体有助于简化人们使用该工具的效率。例如，Co-Pilot 行车助理系统可帮助用户了解某款应用的所有功能，如何自动执行这些功能，或者为用户提出如何以最佳方式使用该工具的建议。

示例：利用智能体蜂群和 OODA 循环策略优化数据中心性能。

数据分析

数据分析可由用于提取和理解数据的多智能体系统执行。可以将数据分析视为一种“提取并执行”策略，其中一组智能体共同协作，从短期或长期记忆甚至 PDF 中收集数据，然后另一组执行智能体通过调用 API 来触发数据分析工具。

示例：“今年公司有多少个季度产生了正向现金流？”

客户服务

AI 智能体可提供全天候支持，同时理解文本和语音形式的自然语言查询，通过代表客户采取行动来解决复杂问题。

示例：呼叫中心接线员或聊天机器人可以自动执行工作流任务，例如连接 CRM 等内部系统，检查看客户请求是否符合退款条件，或者输入启动退货所需的数据。

协助软件开发

AI 智能体可以充当软件开发者的编码助手，帮助提供编码建议，指出错误并提供一键修复，提供拉取请求汇总并生成代码。

示例：当今最热门的 AI 智能体之一 GitHub Copilot 可以作为开发者的助手，生成代码，提出编码建议，管理文档并修复错误。

供应链管理

多智能体系统（或智能体“蜂群”）可以通过实时分析数据、根据需求监控和调整库存水平来帮助优化供应链，甚至可通过密切关注市场波动情况来帮助采购原材料。

示例：分层式智能体系统可以由多层智能体组成，它们负责供应链的不同方面，并向根据数据做出决策的编排智能体上报相关情况。

如何开始使用 AI 智能体？

NVIDIA 提供了各种工具和软件，可帮助轻松开发并大规模部署代理式 AI。

NVIDIA Blueprint 为开发者构建使用一个或多个 AI 智能体的 AI 应用提供了切入点。它们包含使用 NVIDIA AI 和 NVIDIA Omniverse™ 库、SDK 和微服务构建的示例应用，为自定义 AI 解决方案奠定了基础。每个 Blueprint 都包含用于构建工作流的参考代码、工具、部署和定制文档，以及概述了 API 定义和微服务互操作性的参考架构。
开发者可以访问 NVIDIA API 目录中的最新 AI 模型，以构建和部署自己的代理式 AI 应用。

后续步骤

NVIDIA Blueprint

开始使用 NVIDIA Blueprint，探索面向代理式和生成式 AI 用例的参考工作流。

构建定制 AI 智能体

数字人

数字人是 AI 智能体的外在形象。深入了解这项技术如何推动医疗健康和游戏等行业的转型。

立即阅读

NVIDIA 开发者计划

免费访问代理式 AI 基础模组 NVIDIA NIM™，进行应用开发、研究和测试，并获取技术学习资源。