AI 智能体是先进的 AI 系统,旨在根据高级目标自主进行推理,制定计划并执行复杂任务。
AI 智能体是新兴的数字化劳动力,既为我们服务,也与我们协作。它们代表人工智能领域的下一次演进,即从简单自动化向能够管理复杂工作流的自主系统过渡。这些智能体不仅可以自动执行耗时的重复性任务,而且可以充当智能个人助手,帮助个人和企业组织提高运营效率。
与遵循基本“请求和响应”框架的传统生成式 AI 模型不同,AI 智能体还能编排资源,与其他智能体协作,并使用各种工具,如大语言模型 (LLM)、检索增强生成 (RAG)、向量数据库、API、框架以及 Python 等高级编程语言,从而实现超越。
这些系统通常被称为“代理式 AI”或“LLM 智能体”,由于能够通过迭代规划和决策制定来实现目标,因此在市场上脱颖而出。例如,用于构建网站的 AI 智能体可以自主管理布局设计、HTML 和 CSS 代码编写、后端流程连接、内容生成和调试等任务,同时尽可能减少人工输入。
代理式 AI 工作流的工作原理
要了解 AI 智能体的工作原理,分析其核心组件至关重要。这些组件协同工作,帮助智能体高效进行推理,制定计划并执行任务:
AI 智能体可将核心组件无缝整合在一起,处理复杂的任务。下面的示例说明了这些组件如何协同工作,以响应特定用户请求。
提示词示例:分析我们的最新季度销售数据,然后提供一个图表。
组件协同工作,对请求做出响应
用户甚至是另一个智能体或系统请求分析销售数据并提供视觉表示,启动了智能体工作流。智能体处理此输入,并将其分解为可操作的步骤。
LLM 充当 AI 智能体的大脑。它解读用户的提示词,以理解任务要求,例如:
LLM 确定:
规划模组会将任务划分解为具体的操作:
记忆模组确保保留上下文,以便高效执行任务:
智能体核心通过编排外部工具来完成每个步骤:
在整个过程中,智能体会运用推理来优化工作流并提高准确性。这包括:
例如,如果生成的图表需要改进,智能体会调整方法,以便在后续工作流中提供更好的结果。
推理层是代理式 AI 的一个决定性特征,可帮助智能体思考如何实现目标。通过将 LLM 功能与 API、编排软件和上下文记忆等工具相结合,推理可助力智能体准确高效地应对复杂环境。由于具有这种适应性,AI 智能体成为一类至关重要的工具,可帮助自动执行和优化复杂工作流。
AI 智能体可以直接使用 Python 编写,用于执行简单工作流和实验的智能体尤其如此。迁移到更复杂的工作流或生产环境时,遥测、日志记录和评估变得至关重要,此时智能体框架将发挥重大作用。AI 智能体框架为专用开发平台或库,旨在简化 AI 智能体的构建、部署和管理流程。这些框架消除了构建智能体系统的过程中存在的大部分底层复杂问题,使开发者能够专注于特定的应用和智能体行为,而非实施的技术细节。
在选择 AI 智能体框架时,必须考虑诸多因素,例如:
鉴于这些要求,一系列框架应运而生,可满足不同用例和复杂程度的需求。
有多种方法可用于实施 AI 智能体,例如,引入自己的 Python、LangChain 和 Llama 堆栈。
AI 智能体可以根据复杂程度、决策制定过程以及对环境的适应程度来分类。下面列出了主要的 AI 智能体类型,涵盖了简单的系统到高度智能化的自适应框架:
智能体的类型 | 主要特征 | 用例示例 |
---|---|---|
简单反射型 | 根据当前感知和预定义规则执行操作 没有记忆或适应能力 |
恒温器根据传感器输入调节温度 |
基于模型的反射型 | 保留短期记忆或由规则指导的环境操作模型 | 导航系统根据交通状况更新路线 |
目标型 | 根据当前感知和预定义规则执行操作 没有记忆或适应能力 |
送货机器人优化前往目的地的路线 |
分层式 | 多层系统通过更高级别的智能体来管理专用智能体 | 工厂自动化系统与监督者和专业机器人协同工作 |
学习型 | 通过反馈和经验进行学习和调整 使用学习组件 |
AI 推荐系统随着时间推移而改进建议 |
多智能体系统 (MAS) | 与其他智能体协作实现共同目标 在协调系统中运行 |
无人机队群协作投递包裹 |
效用型 | 通过最大限度地增加每次操作的效用或奖励来优化结果 | 动态定价算法根据市场条件调整费率 |
特性 | AI 助手 | AI 智能体 |
---|---|---|
目的 | 根据用户命令简化任务 | 自主完成复杂的多步骤目标驱动型任务 |
任务复杂程度 | 低到中 | 中到高 |
交互性 | 反应式 | 主动式 |
自主性 | 低: 依赖人工指导 |
高: 独立 基于规划和推理 |
学习能力 | 低: 最小(如果有) |
高: 从交互中学习,随着时间推移进行调整 |
集成度 | 高: 但仅限于特定应用 |
广泛性: 包含 API、数据库和工具 |
总的来说,AI 智能体的潜在用例不可胜数。部署 AI 智能体依赖想象力和专业知识,涵盖了生成和分发内容等简单用例,以及编排企业软件和数据库功能等复杂用例。
任务执行智能体(也可称为“API 智能体”或“执行智能体”)可以使用一组预定义执行功能来完成用户请求的任务。
示例:“为我写一篇社交媒体帖子来推销我们的最新产品,务必提到它正在特价销售,现在推出了绿色款。”
构建您的首个用于创作数字内容的 AI 智能体
用于特定应用的 AI 智能体有助于简化人们使用该工具的效率。例如,Co-Pilot 行车助理系统可帮助用户了解某款应用的所有功能,如何自动执行这些功能,或者为用户提出如何以最佳方式使用该工具的建议。
示例:利用智能体蜂群和 OODA 循环策略优化数据中心性能。
数据分析可由用于提取和理解数据的多智能体系统执行。可以将数据分析视为一种“提取并执行”策略,其中一组智能体共同协作,从短期或长期记忆甚至 PDF 中收集数据,然后另一组执行智能体通过调用 API 来触发数据分析工具。
示例:“今年公司有多少个季度产生了正向现金流?”
AI 智能体可提供全天候支持,同时理解文本和语音形式的自然语言查询,通过代表客户采取行动来解决复杂问题。
示例:呼叫中心接线员或聊天机器人可以自动执行工作流任务,例如连接 CRM 等内部系统,检查看客户请求是否符合退款条件,或者输入启动退货所需的数据。
AI 智能体可以充当软件开发者的编码助手,帮助提供编码建议,指出错误并提供一键修复,提供拉取请求汇总并生成代码。
示例:当今最热门的 AI 智能体之一 GitHub Copilot 可以作为开发者的助手,生成代码,提出编码建议,管理文档并修复错误。
多智能体系统(或智能体“蜂群”)可以通过实时分析数据、根据需求监控和调整库存水平来帮助优化供应链,甚至可通过密切关注市场波动情况来帮助采购原材料。
示例:分层式智能体系统可以由多层智能体组成,它们负责供应链的不同方面,并向根据数据做出决策的编排智能体上报相关情况。
NVIDIA 提供了各种工具和软件,可帮助轻松开发并大规模部署代理式 AI。