为点燃新一代发现的火花,科学家们希望通过仿真,更好地理解复杂分子结构以支持药物研发,理解物理现象以寻找新能源,理解大气数据以更好地预测极端天气状况。领先的仿真和应用利用 NVIDIA Magnum IO 来加速探索进程。Magnum IO 提供硬件级加速引擎和智能卸载,例如 RDMA、NVIDIA GPUDirect 和 NVIDIA SHARP 功能,同时支持超高带宽、超低延迟的 NVIDIA InfiniBand 和 NVIDIA NVLink 网络。
在多租户环境中,用户应用可能并不知晓相邻应用流量的无差别干扰。在新一代的 NVIDIA Quantum-2 InfiniBand 平台上, Magnum IO 带来一个新的改进功能,用以减轻流量干扰对用户性能的负面影响。这可以实现比较理想的性能,并做到在任何规模下,都能高效部署 HPC 和机器学习应用。
Magnum IO 库和 HPC 应用
用 NCCL 替换 MPI 可以显著提升 VASP 的性能。UCX 可以加速 VASP、Chroma、MIA-AI、Fun3d、CP2K 和 Spec-HPC2021 等科学计算应用,从而缩短运行时间。
NVIDIA HPC-X 可以提高 CPU 可用性、应用可扩展性和系统效率,从而提高应用性能,并已经获得多种 HPC ISV 的支持。NCCL、UCX 和 HPC-X 均为 HPC-SDK 的组成部分。
快速傅里叶变换 (FFT) 广泛应用于分子动力学、信号处理、计算流体动力学 (CFD)、无线多媒体和 ML 应用等各个领域。在 NVIDIA Shared Memory Library (NVSHMEM)™ 的助力下,cuFFTMp 可独立于 MPI 实现,实现了极致性能。这一点尤为重要,因为不同 MPI 的性能可能会有很大差异。
定性数据分析 (QUDA) 格点量子色动力学库可以使用 NVSHMEM 进行通信,以减少 CPU 和 GPU 同步产生的开销并改善计算和通信的重叠度,从而减少延迟并提高扩展性。
多节点多 GPU:大规模应用 NVIDIA cuFFTMp FFT
大规模交互式立体数据可视化:150TB 的 NASA 火星着陆器仿真