开创先河的硬件到软件堆栈,已针对数据科学进行优化。
一直以来,数据科学工作流程缓慢又繁琐,无论是加载、筛选和操控数据,还是训练和部署模型,都依赖于 CPU 来完成。借助 NVIDIA AI 软件(包括 RAPIDS™ 开源软件库),GPU 可显著降低基础设施成本,并使端到端数据科学工作流程实现卓越性能。从笔记本电脑到数据中心,再到边缘和云端,GPU 加速的数据科学无处不在。
减少为获得宝贵见解而等待的时间,并加快提升投资回报率。
可将机器学习训练速度提升高达 215 倍,执行更多迭代,增加实验,并进行更深入的探索。
降低数据科学基础设施成本,同时提升数据中心效率。
适用于 Spark、pandas 和 networkX。
* 根据 Groupy 高级操作 (5GB) DuckDB 数据基准进行基准测试
硬件:英特尔至强 Platinum 8480CL CPU 和 NVIDIA Grace Hopper™ GPU
软件:pandas v1.5 和 cudf.pandas v23.10
* NDS 2.0 基准测试是在 SF3K 关闭 UCX 的情况下使用 Parquet 十进制数据进行的
仅 CPU:8 个 n1-standard-32 CPU
GPU:8 个 g2-standard-16 GPU、8 个 L4 24GB GPU
软件:Spark RAPIDS 24.02
* 使用具有约 16,384 个顶点和约 524,288 个边的合成数据集对 PageRank 进行基准测试
硬件:英特尔至强 Platinum 8480CL CPU 和 NVIDIA H100 80GB(1 个 GPU)
软件:NetworkX v3.2 和 cuGraph v23.10
在单节点部署和分布式部署中,GPU 加速的 XGBoost 可为领先的机器学习算法带来颠覆以往的性能。由于训练速度比 CPU 快得多,数据科学团队可以处理更大的数据集、更快地迭代,并调优模型以更大限度地提升预测精度和业务价值。
CPU: Core i9 | 端到端时间 = 数据准备 + 转换 + 训练 + 验证
立即了解如何开始使用 GPU 加速的 XGBoost
了解各种不同的 NVIDIA GPU 解决方案提供的惊人加速
更大限度提升机器学习工作流程的性能、生产率和投资回报率。
RAPIDS 基于 NVIDIA CUDA-X AI,充分利用了超过 15 年的 NVIDIA® CUDA® 开发和机器学习专业知识。这是一款功能强大的软件,用于完全在 NVIDIA GPU 中执行端到端的数据科学训练流程,可将训练时间从数天减少到数分钟。
RAPIDS 面向所有人开放,并在全球范围内的数据科学和分析领域得到广泛应用。我们的合作伙伴正在齐心协力地利用 GPU 加速分析、机器学习和深度学习方面的技术进步,彻底革新传统的大数据分析生态系统。
探索 GPU 加速的硬件解决方案