本课程教授如何使用基本的工具和技术,通过在GPU上的CUDA® 和NUMBA编译器,来加速Python应用程序的运行。在GPU支持的实时云端开发环境上, 您将完成十几个动手编码练习,并在培训结束时实践一个新的工作流程,来加速全功能但仅支持 CPU 的线性代数程序,从而获得显著的性能提升。 课程结束后,您将拥有更多资源来自行创建新的GPU加速应用程序。
学习目标
课程结束后,您将了解使用 CUDA 和 Numba 实现GPU加速Python 应用程序的基本工具和技能。
> 只需使用几行代码即可实现 GPU 加速的 NumPy ufuncs 。
> 利用CUDA线程层次结构配置代码并行化。
> 编写自定义 CUDA 核函数实现最大性能和灵活性。
> 使用内存合并和设备上共享内存来增加CUDA核函数的带宽。
下载课程大纲 (PDF 298 KB)