仿真可通过加速基础模型的训练来解锁新型用例,或者通过合成数据生成 (SDG) 加速预训练 AI 模型的微调流程。它可以由视觉和非视觉频谱中的文本、2D 或 3D 图像组成,甚至可以与真实世界数据结合使用来训练多模态物理 AI 模型。
域随机化是 SDG 工作流的关键步骤,在这一步中,可以通过改变场景中的许多参数来生成多元化数据集,从对象的位置到颜色、纹理,再到照明。后处理阶段的增强通过添加缺陷(如局部模糊、像素化、随机裁剪、偏斜和混合),使生成的数据进一步多元化。
此外,生成的图像会被自动注释,还可包含 RGB、边界框、实例和语义分割、深度、深度点云、激光雷达点云等信息。