数字人技术是以人工智能为基础的虚拟智能机器人,它结合了最新的 3D 建模技术和交互式 AI 语音技术的优势,具备出色的亲和性,符合人类自然交流习惯,在元宇宙的大潮中备受瞩目,非常有潜力成为下一代人机交流主要界面。目前,数字人技术已经在泛娱乐、金融、教育、政务、汽车、医疗、零售等领域取得了相当不错的发展势头,成为业界的技术发展热点。凭其灵活的可定制性和高度智能化的特点,数字人技术可以为企业提供高质量、高效率、个性化且低成本的交互服务,从而有效地优化企业运营流程、提升客户体验,增强品牌形象,创造更加美好的商业未来。
本课程主要面向希望学习使用 NVIDIA Omniverse 来构建虚拟数字人的开发人员。从端到端应用开发的角度,课程重点讲解如何使用语音驱动自定义的数字人的面部动作和表情,以及用微服务方式控制数字人的身体动作。课程同时介绍如何通过 NVIDIA Riva 为数字人构建一套交互式语音系统后端,包含自动语音识别(ASR)、NLP 问答,以及语音合成(TTS)等模块。课程最后学习如何将前期开发的各个系统有机串联起来,以构建一个完整的数字人交互系统。
学习目标
参加本次培训,您将学习到:
- 如何在 Audio2Face 中通过角色迁移驱动任意虚拟人物头像的面部动作
- 如何通过 Extensions 以及微服务(Microservices)的方式实现虚拟人物肢体动作的控制
- 如何使用 Riva 快速构建自动语音识别(ASR)系统、基于自然语言的问答系统,以及语音合成(TTS)的发声服务系统
- 如何有效连接虚拟人和语音系统,从而构建一个基础的交互式虚拟数字人应用
下载课程大纲文档 (PDF 528 KB)