将基于主要从互联网上收集的大量文本和图像数据来训练生成式 AI 模型,例如 GPT 和 Llama 等大型语言模型。这些 AI 模型在生成人类语言和抽象概念方面能力惊人,但它们对物理世界了解有限,并受其规则约束。
由于生成式物理 AI 能够理解我们居住的三维世界的空间关系和物理行为,因而扩展了当前的生成式 AI。它通过在 AI 训练过程中提供其他数据来实现上述理解,这些数据包含与现实世界的空间关系和物理规则有关的信息。
3D 训练数据由高度精确的计算机模拟生成,后者既充当数据源,也作为 AI 训练场。
基于物理的数据生成始于某个空间(例如工厂)的数字孪生。然后在这个虚拟空间中添加传感器和自主机器(如机器人)。接着执行模拟以模仿现实世界场景,传感器会捕捉各种交互,如刚体动力学(例如运动和碰撞)或光在环境中的交互作用。