Tesla P100 采用 Pascal 架构,在数据中心吞吐量方面实现了巨大飞跃
ISC16 - 为满足对现代数据中心超高的计算需求,NVIDIA 今天发布了适用于 PCIe 服务器的 NVIDIA® Tesla® P100 GPU 加速器。与基于 CPU 的系统相比,该加速器在性能和价值方面实现了更大的飞跃。
对超级计算周期的需求较以往更高。来自美国国家科学基金会的数据显示1,大多数科学家无法保证有足够的时间在超级计算系统上进行他们的研究。此外,高性能计算 (HPC) 技术日益成为计算密集型深度学习应用程序所需要的技术。同时,研究人员正使用人工智能技术来推动传统科学领域的进步。
适用于 PCIe 的 Tesla P100 GPU 加速器能够通过 NVIDIA Pascal™ GPU 架构所具备的超高性能和效率满足这些计算需求。用户可利用该加速器创建“超级节点”,提供超过 32 个基于 CPU 的通用节点,还能降低高达 70% 的资本和运作资本。2
NVIDIA 加速计算部门副总裁 Ian Buck 说:“加速计算是能够跟上研究人员对 HPC 和人工智能超级计算不断增加的需求的唯一途径。通过部署仅使用 CPU 的系统来满足这种需求将需要大量的通用计算节点,这会导致成本大幅增加而比例性能却毫无提升。通过更少、更强大的 Tesla P100 驱动的节点可极大地扩展性能,从而将更多的资金用于计算而不是大量的基础设施开销。”
适用于 PCIe 的 Tesla P100 现已以标准 PCIe 外形推出,并与现有的 GPU 加速服务器兼容。我们已对其进行优化,以驱动计算密集程度超级高的人工智能和 HPC 数据中心应用程序。单个 Tesla P100 驱动的服务器在运行 AMBER 分子动力学代码时,所提供的性能高于 50 个仅使用 CPU 的服务器节点,3而且在运行 VASP 材料科学应用程序时的速度要高于 32 个仅使用 CPU 的节点。4
今年晚些时候,适用于 PCIe 的 Tesla P100 加速器将搭载于欧洲目前最快的超级计算机 Piz Daint 系统(位于瑞士卢加诺的瑞士国家超级计算中心)的升级版上。
瑞士国家超级计算中心主任兼苏黎世联邦理工学院计算物理学教授 Thomas Schulthess 说:“Tesla P100 加速器将性能和效率提升到了新的水平,从而能够解决当今世界所面临的一些重大计算挑战。将 Piz Daint 上的 4500 个 GPU 加速节点升级至 Tesla P100 GPU 之后,系统性能将提升至 2 倍以上,使研究人员在一系列领域(包括宇宙学、材料科学、地震学和气候学)取得突破。”
适用于 PCIe 的 Tesla P100 是 NVIDIA Tesla 加速计算平台的最新成员。主要功能包括:
- 适用于混合 HPC 工作负载的超强应用程序性能 -- 可提供高达 4.7 万亿次的双精度浮点运算能力和 9.3 万亿次的单精度浮点运算能力,单个基于 Pascal 架构的 Tesla P100 节点可提供相当于超过 32 个仅使用 CPU 服务器的性能。
- 采用 HBM2 的 CoWoS 带来超凡效率 -- Tesla P100 将处理器与数据封装到一起,实现了极其惊人的计算效率。采用 HBM2 的晶圆基底芯片 (CoWoS) 技术运用显存设计的创新方法,可提供相当于 NVIDIA Maxwell™ 架构 3 倍(720GB/秒)的显存带宽性能。
- 适用于简化并行编程的页面迁移引擎 -- 开发人员可专注于提高性能而无需分心管理数据移动。并且,在虚拟显存分页的支持下,应用程序现在可以突破 GPU 物理显存的容量限制。借助统一显存技术,开发人员可为整个节点找到单独的显存空间,从而显著提升工作效率。
- 极强的应用程序支持 -- Tesla 平台是领先的 HPC 计算平台,有 410 个 GPU 加速的应用程序(其中包括十大 HPC 应用程序中的 9 个)。
适用于 PCIe 的 Tesla P100 规格
- 借助 NVIDIA GPU BOOST™ 技术实现 4.7 万亿次双精度浮点运算能力、9.3 万亿次单精度浮点运算能力和 18.7 万亿次半精度浮点运算能力
- 对 PCIe Gen 3 互联的支持(双向带宽为 32GB/秒)
- 提升了使用页面迁移引擎和统一显存技术编程的能力
- 提供 ECC 保护,增强可靠性
- 服务器经过优化,可以更大程度地提高数据中心吞吐量和可靠性
- 适用于以下两种配置:
- 16GB 的 CoWoS HBM2 堆叠式显存,提供 720GB/秒的显存带宽
- 12GB 的 CoWoS HBM2 堆叠式显存,提供 540GB/秒的显存带宽
- 16GB 的 CoWoS HBM2 堆叠式显存,提供 720GB/秒的显存带宽
- 12GB 的 CoWoS HBM2 堆叠式显存,提供 540GB/秒的显存带宽
上市情况
适用于基于 PCIe 系统的 NVIDIA Tesla P100 GPU 加速器预计将于 2016 年第 4 季度由 NVIDIA 经销商合作伙伴和服务器制造商(包括 Cray、戴尔、惠普、IBM、联想和 SGI)推出。
其他资源
提升 HPC 吞吐量(视频)
深入了解 Pascal(博客)
随时关注NVIDIA 动态
订阅 NVIDIA 博客,通过 Facebook、
Twitter、LinkedIn 和 Instagram 关注我们,通过 YouTube 观看 NVIDIA 视频,并通过 Flickr 查看图片。
关于 NVIDIA® (英伟达™) 公司
自从 1993 年以来,NVIDIA (纳斯达克代码: NVDA) 一直在视觉计算的艺术与科学发展中勇当开路先锋。NVIDIA 公司的诸多技术正在彻底转变显示世界的面貌,使其成为充满互动与探索的世界,这将影响所有人,不论是游戏玩家、科学家还是消费者或者是企业客户。如需了解更多信息,敬请访问 //www.nvidia.cn/object/newsroom_cn.html 和 //blogs.nvidia.cn。
NVIDIA 新闻中心://www.nvidia.cn/object/newsroom_cn.html
NVIDIA 新浪微博://e.weibo.com/nvidiachina
NVIDIA 腾讯微博://t.qq.com/NVIDIAChina
# # #
(1) 来源: https://portal.xsede.org/#/gallery
(2)CPU 服务器:双套接字 Intel E5-2680v3 12 核、128GB DDR4 每节点、FDR IB/GPU 服务器:配备双套接字 Intel E5-2680v3、适用于 PCIe 的 8 倍 Tesla P100
(4) VASP 5.4.1_05Feb16,Si-Huge Dataset。16,32 个节点是根据与 4-8 个节点相同的扩展估算的。
# # #
本新闻稿中的部分声明包括但不限于关于以下内容的声明:NVIDIA Tesla P100 GPU 加速器的影响、性能、优势和上市情况,对高性能计算技术不断增长的需求,以及 HPC 和人工智能超级计算的加速计算角色均为前瞻性声明,存在风险与不确定性,最终结果可能与预期存在极大差异。可能导致实际结果产生极大差异的重要因素包括:全球经济状况;在制造、组装、包装和测试产品方面,我们对第三方的依赖性;技术发展和竞争的影响;新产品和技术的发展或对我们现有产品和技术的增强;市场对我们的产品或合作伙伴产品的接受情况;设计、制造或软件缺陷;消费者偏好或需求的变化;行业标准和界面的变化;在将我们的产品或技术集成到系统中时意外损耗的性能;以及 NVIDIA 提交给美国证券交易委员会 (SEC) 的报告(包括于 2016 年 5 月 1 日结束的财务期间 Form 10-Q)中时常具体说明的其他因素。提交给 SEC 的报告的副本会张贴在公司的网站上且可免费从 NVIDIA 获得。这些前瞻性声明不能保证未来的表现,仅在规定日期有效。除非法律另有要求,否则 NVIDIA 对更新这些前瞻性声明以反映未来事件或环境不承担任何责任。
© 2016 NVIDIA Corporation.保留所有权利。NVIDIA、NVIDIA 徽标、Tesla、Pascal、Maxwell 和 NVIDIA GPU BOOST 均为 NVIDIA Corporation 在美国和其他国家/地区的商标和/或注册商标。文中提及的其他公司和产品名称可能是其相应所有者的商标。功能、定价、供货信息和规格如有变更,恕不另行通知。
# # #
媒体咨询,请联络: 金洋 (Steven Jin) 陈仲禹、张国双 |
###
© NVIDIA 公司版权所有,2016 年。保留所有权利。所有的公司和/或产品名称可能是与之对应的所有者的商标和/或注册商标。特性、价格、供货时间和规范可在未加通知的情况下加以更改。
编者注:如果您希望了解有关 NVIDIA 的更多信息,请访问 NVIDIA 的新闻室: http://www.nvidia.cn/page/press_room.html