就像人类拥有多种感官来感知周围的世界一样,计算机也有各种传感器来帮助感知人类世界。在医疗行业,计算机断层扫描(CT)提供了用于检测潜在危险异常的 3D 表示。机器人行业,激光雷达被用来帮助机器人感知深度并在周围复杂的地形中导航。本课程中,学员将探索不同的融合技术,开发能使用多种不同数据类型进行推理的神经网络智体。
学习目标
- 不同的数据类型及如何使其适用于神经网络
- 模型融合,以及早期融合、晚期融合和中期融合的区别
- 使用 OCR 进行 PDF 提取
- 模态和智能体编排的区别
- 使用视频搜索和摘要(VSS)定制 NVIDIA AI Blueprints
下载课程大纲 (PDF 184 KB)