This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

关于本书 - 加速 Apache Spark 3

Apache Spark 是一款功能强大的执行引擎，用于跨计算机集群进行大规模并行数据处理，从而实现快速应用程序开发和高性能表现。

在本电子书中，您将了解 Spark 3 的创新如何助力使用 GPU 的大规模并行架构来进一步加速 Spark 数据处理。

填写表单下载电子书并了解以下内容：

数据处理从 Hadoop 到 GPU 和 NVIDIA RAPIDS™ 库的演进
Spark 的含义、作用及重要性
Spark 中的 GPU 加速
DataFrame 和 Spark SQL
带随机森林分类器的 Spark 回归示例
端到端机器学习工作流程（利用 XGBoost 进行 GPU 加速）的示例

Data Science ebook