借助 NVIDIA GPU 加速所有主要的 Apache Spark 3 平台,无需更改代码。
加速提升数据准备任务的性能,更快地训练 AI 模型并实现实时分析。
用更少的资源完成更多的工作:与 CPU 相比,基于 NVIDIA GPU 的 Spark 能以更少的硬件更快地完成任务,从而节省时间以及本地资本成本或云端运营成本。
快速体验优势,无需更改代码。随附的工具可确定适用于 GPU 加速的最佳作业,并计算优化配置。
GPU 加速可通过多种方式帮助您改善业务成果。以下是适用于 Apache Spark 的 RAPIDS 加速器的一些关键用例。
不断增长的数据量给 IT 资源带来压力。GPU 加速赋能计算基础设施,因此可以处理更多数据。通过加速运营,Taboola 能够在其现有数据中心占地面积内保持处理截止日期,处理不断增长的数据量。
AI Pipelines 由多个步骤组成,包括数据准备、转换、特征工程和数据提取。使用 GPU 加速这些操作可缩短训练时间,并大幅降低基础设施成本。ATandT 将 AI Pipelines 的成本和时间降低了 70%.
企业依靠最新数据做出关键的运营决策。GPU 加速使其能够处理最新信息并实时获得见解。借助 GPU,CapGemini 帮助一家国际零售商将交易处理时间从几天缩短到几个小时。
评估您自己的 Apache Spark 工作负载的 GPU 加速潜力,并了解如何配置集群以大幅节省成本。
NVIDIA AI Enterprise 提供适用于 Apache Spark 的 RAPIDS 加速器。通过在本地和云端的认证平台(包括 Amazon EMR、Google Cloud Dataproc 和 Databricks)上获得全面的企业级支持、安全性和稳定性,为 Spark 部署提供优化的性能。利用有保证的响应时间、优先安全通知以及与 NVIDIA 数据科学专家联系的机会。
Cloudera 和 NVIDIA 的集成将使我们能够使用数据驱动的见解为任务关键型用例提供支持。我们目前正在实施这一集成,并且已经实现了 10 倍以上的速度提升,而我们的数据工程和数据科学工作流程的成本仅为一半。
— IRS 应用分析和统计研究技术部门主管 Joe Ansaldi
与在 CPU 上运行 Spark 相比,我们发现 NVIDIA 加速的 Spark 3 的性能显著提升。随着这些颠覆性的 GPU 性能提升,我们在全套 Adobe Experience Cloud 应用中增强 AI 驱动功能的可能性也随之出现。
— William Yan, Adobe 机器学习高级总监
我们持续与 NVIDIA 合作,通过针对 Apache Spark 3 和 Databricks 的 RAPIDS 优化来提高性能,使 Adobe 等我们的联合客户受益。这些贡献带来了更快的数据 pipelines、模型训练和评分,这直接转化为我们的数据工程师和数据科学家社区的更多突破和见解。
— Matei Zaharia, Apache Spark 的原始创建者兼 Databricks 首席技术专家
要挖掘 AI 驱动的大数据价值,并详细了解 Apache Spark 的下一次演进,请下载电子书《加速 Apache Spark 3.x - 利用 NVIDIA GPU 助力分析和 AI 新时代》