本课程主要面向数据科学家和在银行从事金融反欺诈建模方向的从业人员,教授如何训练、加速和优化基于机器学习和深度学习的欺诈检测分类器。
在大数据时代,传统以 CPU 为主的模型训练方式已经愈发不堪重负,呈指数级增长的训练数据导致模型训练时间过长以及参数调优效率降低,直接影响终端银行信用业务的欺诈检测效率。同时,因为金融数据包含着大量个人隐私信息,既要做到规避隐私泄漏风险,又不能影响验证不同模型分类器的表现。
在本课程中,基于机器学习技术,专注教授基于梯度提升 (Gradient boosting) 的 XGBoost 和随机森林模型的训练、调参优化以及加速;基于深度学习技术,重点讲解多层前馈全连接神经网络 (MLP) 和图神经网络 (GNN) 为主的模型训练和表现,以及展示如何用 GPT 模型做金融数据仿真;最后介绍如何通过 NVIDIA 软件堆栈 Triton™ 推理服务器来对模型进行推理和优化加速。完成本课程,您将了解并掌握如何用 GPU 加速前期数据清洗和特征工程,如何加速最为耗时的机器学习的参数调优过程,如何搭建不同的神经网络来提高欺诈检测率,并能够对不同的检测分类器做出性能评估,以及完成最终的应用部署。
学习目标
- 如何使用 RAPIDS 和 CuPy 加速数据清洗和特征工程
- 如何使用 GPU 加速 XGBoost 模型调参和训练过程
- 如何使用全连接网络构建反欺诈模型
- 如何使用NVIDIA NeMo完成金融数据仿真
- 如何使用基于 DGL 训练的图神经网络搭建反欺诈模型
- 如何使用 NVIDIA Triton™ 完成模型部署上线
下载课程大纲 (PDF 363 KB)