数据飞轮是一种反馈循环机制,通过从交互或流程中收集数据,持续优化 AI 模型,进而产生更优的结果和更有价值的数据。
AI 数据飞轮的工作原理是通过创造循环机制,帮助 AI 模型整合机构知识与用户反馈,从而实现持续的改进。当模型生成输出结果时,数据飞轮会将反馈与新数据收集起来,用于模型的优化与增强。这一流程涉及数据管护与数据质量的提升,以便确保 AI 模型的精度和性能均得到持续改善。
图 1:数据飞轮:由数据处理、模型定制、评估、护栏和及部署构成的持续运转周期,能够利用企业数据改进 AI 系统
此外,数据飞轮内置 AI 护栏,以保持数据的完整性和可靠性,确保输出结果准确、合规、安全。这种持续的反馈和增强周期能够使 AI 模型的效能与日俱增。这一工作流由六大步骤组成:
1. 数据处理:AI 数据飞轮的基础是企业数据。这类数据形式多样,包括文本文档、图像、视频、表格和图表。AI 数据飞轮需要通过对原始数据进行数据处理来提取和优化信息。随后,原始数据将接受进一步的筛选,去除低质量文档、个人身份信息 (PII) 与不良、有害数据,生成高质量数据。这样的数据管护能够有效提高应用的准确性。
2. 模型定制:借助领域自适应预训练 (DAPT) 和监督式微调 (SFT) 等大语言模型 (LLM) 技术,您能够在资源要求较低情况下,快速为模型增添领域特定知识与任务专属技能。到这一步,模型已对公司的特有词汇和上下文有了更深的理解。
3. 模型评估:接下来,您可以评估模型性能、验证答案(输出)是否符合应用的要求。以迭代的方式执行前三步,能够确保模型质量得到改进,且结果符合目标应用的要求。
4. AI 护栏实施:将 AI 护栏添加到定制模型中,可确保应用的部署符合企业对隐私、安全保障和安全的特定要求。
5. 自定义模型部署:在同时部署生成式 AI 和代理式 AI 应用时,从不断扩大的数据库中持续检索信息。用户反馈和系统运行数据会被反复收集。借助 AI 数据飞轮,您可以在基于应用交互构建机构知识的同时,生成经优化、更智能的答案。
6. 企业数据优化:由此产生的结果就是,随着时间推移,机构数据会基于收集自人类反馈和 AI 模型反馈的新数据持续更新。随着流程的重复,这一过程将反馈到数据处理中。
角色 | 责任 |
---|---|
数据工程师 | 必须对结构化和非结构化数据进行管护,以生成用于训练 AI 模型的高质量数据 |
AI 软件开发者 | 必须利用经管护的数据集进一步训练 AI 模型,满足专业化的目的 |
IT 与 MLOps 团队 | 必须将模型部署在安全的环境中,同时将使用和访问要求纳入考量 |
人机回圈与 AI 系统 | 必须审查生成的机构知识,并对数据库进行具有一致性的调整,因为数据会持续反馈至数据引擎 |
在采用 AI 智能体和生成式 AI 应用时,需要借助数据飞轮来推动软件持续改进、提升适应性。例如,随着业务需求发生变化或复杂性增加,性能和成本往往成为决定商业成败的关键。
借助高效的 AI 数据飞轮,企业组织可以:
为保持竞争优势,企业组织可以收集处理新的交互数据、优化 AI 模型,并逐步提升其 AI 应用的性能。从 LLM 到视觉语言模型 (VLM),可用于集成的数据类型丰富多样。
开发团队也可以加快模型训练速度,专注于利用其专有数据对现有基础模型进行调优。生成式 AI 微服务可通过 API 调用进一步简化这一流程。
这种方法能够大幅减少开发和部署代理式 AI 和生成式 AI 解决方案所需的时间和资源。
加速 AI 数据飞轮对解决与代理式 AI 技术相关的依赖关系具有重要意义。
例如,如果没有集中式反馈和日志记录系统,我们就难以对系统性能进行跟踪和分析,而这有可能影响数据飞轮的运行速度。如果评估数据集不能准确反映现实世界场景,就有可能导致模型性能欠佳。
随着知识库的更新,系统反馈的相关性可能会下降,从而使飞轮难以实现持续改进。人工干预虽然有益,但需要耗费大量资源和时间。解决这一问题,将有助于在加速数据飞轮同时保持其效能。
这样一来,当系统层面发生大量影响性能的交互时,加速就变得很有必要。例如,在生成式 AI 应用中,准确性和与符合人类偏好很重要。在代理式 AI 应用中,则需要 AI 知识工作者对计划进行简化和执行。
操作要求 | 建议 |
---|---|
促进资源密集型任务,例如训练数据审查 | 通过集中式用户数据采集和自动生成见解,用户数据分类和分流可简化人工干预的审核流程。 |
通过优化模型增强代理式 AI 和生成式 AI 应用 | 数据飞轮可以通过 Helm 图表部署提供支持,也可以通过 API 调用来实现工作流程的特定部分。 |
运行安全部署并保护企业数据 | 在 GPU 加速的云或私有数据中心上运行端到端工作流可提供更高的安全性、隐私性、控制性和集成灵活性。 |
要借助数据飞轮构建新一代代理式 AI 和生成式 AI 应用,需要对机构数据进行快速迭代和利用。
NVIDIA NeMo™ 是一个用于构建数据飞轮的端到端平台,可助力企业利用最新信息对 AI 智能体进行持续优化。
借助 NeMo,企业 AI 开发者能够轻松完成对数据的大规模管护,利用热门调优技术定制 LLM,根据行业和自定义基准测试对模型进行具有一致性的评估,并在护栏的保障下得到适用且可靠的输出结果。
NeMo 平台包含: