开创先河的硬件到软件堆栈,已针对数据科学进行优化。
一直以来,数据科学工作流程缓慢又繁琐,无论是加载、筛选和操控数据,还是训练和部署模型,都依赖于 CPU 来完成。借助 NVIDIA AI 软件(包括 RAPIDS™ 开源软件库),GPU 可显著降低基础设施成本,并使端到端数据科学工作流程实现卓越性能。从笔记本电脑到数据中心,再到边缘和云端,GPU 加速的数据科学无处不在。
减少为获得宝贵见解而等待的时间,并加快提升投资回报率。
可将机器学习训练速度提升高达 215 倍,执行更多迭代,增加实验,并进行更深入的探索。
降低数据科学基础设施成本,同时提升数据中心效率。
适用于 Spark、pandas 和 networkX。
* 根据 Groupy 高级操作 (5GB) DuckDB 数据基准进行基准测试
硬件:英特尔至强 Platinum 8480CL CPU 和 NVIDIA Grace Hopper™ GPU
软件:pandas v1.5 和 cudf.pandas v23.10
* NDS 2.0 基准测试是在 SF3K 关闭 UCX 的情况下使用 Parquet 十进制数据进行的
仅 CPU:8 个 n1-standard-32 CPU
GPU:8 个 g2-standard-16 GPU、8 个 L4 24GB GPU
软件:Spark RAPIDS 24.02
* 使用具有约 16,384 个顶点和约 524,288 个边的合成数据集对 PageRank 进行基准测试
硬件:英特尔至强 Platinum 8480CL CPU 和 NVIDIA H100 80GB(1 个 GPU)
软件:NetworkX v3.2 和 cuGraph v23.10
在单节点部署和分布式部署中,GPU 加速的 XGBoost 可为领先的机器学习算法带来颠覆以往的性能。由于训练速度比 CPU 快得多,数据科学团队可以处理更大的数据集、更快地迭代,并调优模型以更大限度地提升预测精度和业务价值。
CPU: Core i9 | 端到端时间 = 数据准备 + 转换 + 训练 + 验证
立即了解如何开始使用 GPU 加速的 XGBoost
了解各种不同的 NVIDIA GPU 解决方案提供的惊人加速
开启机器学习之旅。
新一代数据科学工作站。
适用于企业生产的 AI 系统。
功能多样的加速机器学习。
更大限度提升机器学习工作流程的性能、生产率和投资回报率。
RAPIDS 基于 NVIDIA CUDA-X AI,充分利用了超过 15 年的 NVIDIA® CUDA® 开发和机器学习专业知识。这是一款功能强大的软件,用于完全在 NVIDIA GPU 中执行端到端的数据科学训练流程,可将训练时间从数天减少到数分钟。
RAPIDS 作为 GPU 加速数据科学平台,是由 Apache Arrow 提供动力支持的新一代计算生态系统。NVIDIA 与 Ursa Labs 携手合作,将加快 Arrow 核心库的创新步伐,并有助于在分析和特征工程工作负载方面带来重大的性能提升。
- Wes McKinney,Ursa Labs 总经理,同时也是 Apache Arrow 和 Pandas 创建者
我使用 RAPIDS XGBOOST 获得了 24 倍加速,现在借助 8 块 GPU,我可以在单个节点上运行规模超大的机器学习 (ML) 工作负载,取代原先的数百个 CPU 节点。你们使 XGBOOST 实现了神速提升,真是不可思议!
- 流媒体公司
我过去遇到的瓶颈是输入/输出 (I/O)。…… 输入 10 家店铺的数据(约 1 百万行)需耗时 10 分钟。借助 RAPIDS,不到 3 分钟时间,我们便能输入约 6000 家店铺的数据(数百万行)。相比之下,旧有基础设施在处理同等规模的数据时很容易就让我们花上四天时间…… 简直太棒了。
一位拥有 6000 家门店的中端市场专业零售商
RAPIDS 面向所有人开放,并在全球范围内的数据科学和分析领域得到广泛应用。我们的合作伙伴正在齐心协力地利用 GPU 加速分析、机器学习和深度学习方面的技术进步,彻底革新传统的大数据分析生态系统。
探索 GPU 加速的硬件解决方案
NVIDIA 隐私政策