基于现实世界数据的虚拟场景包含增强数据和全新的数字资产。
生成式模型可用于创建这两种类型的资产。
扩散模型能够基于文本或图像描述生成高质量的视觉内容。通过学习图像与用于描述它们的文本之间的关系,扩散模型可以用于以编程方式改变图像参数,如布局、资产放置、颜色、对象大小和光照条件等。
支持合成数据生成的神经网络架构包括生成式对抗网络 (GAN) 和变分自编码器 (VAE)。GAN 通过两个神经网络之间的竞争性流程生成数据,其中一个神经网络负责生成数据样本,另一个则对照真实数据对其进行评估。
Transformer 是一种深度学习模型,它也能够生成合成数据。通过学习数据集中的复杂模式和依赖关系,Transformer 能够生成与现有训练数据相对应的全新数据。例如,在自然语言处理中,Transformer 可用于创建新文本内容,模拟给定文本风格和背景。Transformer 可以模拟表格数据,方法是将数据集中的每一行和每一列视为一个序列,学习其中的关系和模式,并生成保持原始数据集特征的新数据。
从资产创建到代码生成,生成式 AI 能够帮助人们创建合成数据集,用于增强适用于不同场景的模型的训练数据集。