Apache Spark 是一款功能强大的执行引擎,用于跨计算机集群进行大规模并行数据处理,从而实现快速应用程序开发和高性能表现。
在本电子书中,您将了解 Spark 3 的创新如何助力使用 GPU 的大规模并行架构来进一步加速 Spark 数据处理。
填写表单下载电子书并了解以下内容:
- 数据处理从 Hadoop 到 GPU 和 NVIDIA RAPIDS™ 库的演进
- Spark 的含义、作用及重要性
- Spark 中的 GPU 加速
- DataFrame 和 Spark SQL
- 带随机森林分类器的 Spark 回归示例
- 端到端机器学习工作流程(利用 XGBoost 进行 GPU 加速)的示例