GPU 助力的深度学习算法和 Transformer 模型将加速药物研发的每个阶段。从训练能够理解化学空间的大型语言模型 (LLM),到分子动力学模拟、蛋白质结构预测以及生成药物设计,新型深度学习技术正在改变科学家探索不断扩展的化学领域的方式。
NVIDIA Clara™ Discovery 集 GPU 加速及优化的框架、工具、应用和预训练模型于一体,用于计算药物研发。Clara Discovery 专为支持跨学科工作流而构建,可帮助科学家和研究人员更快地将药物投放市场,并为疾病机制研究提供新的可能性。
GPU 助力的深度学习算法和 Transformer 模型将加速药物研发的每个阶段。从训练能够理解化学空间的大型语言模型 (LLM),到分子动力学模拟、蛋白质结构预测以及生成药物设计,新型深度学习技术正在改变科学家探索不断扩展的化学领域的方式。
Credit: Mahendra awale, CC BY-SA 3.0 https://creativecommons.org/licenses/by-sa/3.0 , via Wikimedia Commons
在 GTC 大会上,我们宣布推出 BioNemo,这是一款基于 NVIDIA NeMo Megatron 构建的应用框架和云服务,用于在超级计算规模下训练和部署大型生物分子 Transformer AI 模型。BioNeMo 随附预训练的大型语言模型,专为蛋白质、DNA 和简化分子线性输入规范 (SMILES) 的语言而设计。
药物研发涵盖许多工作流,包括探索化学领域、预测蛋白质结构、扫描候选药物以及模拟分子。借助 NVIDIA NGC™ 目录中提供的功能强大的 Clara Discovery 工具,推动在这些领域取得突破。
基于 Transformer 的大型语言模型正在为实时探索化学领域创造新的可能性。BioNeMo 是一种特定领域的框架,用于在超级计算规模下训练和部署基于 NeMo Megatron 的生物分子 LLM。该框架包含 Transformer 模型 MegaMolBART、ESM-1b 和 ProtT5。
MegaMolBART 是一种基于 14 亿个分子(SMILES 字符串)训练的生成式化学模型,可用于药物研发中的各种化学信息学应用,例如反应预测、分子优化和小分子的重新生成。
ProtT5 和 ESM-1b 表明,无监督式预训练可用于生成包含属性的习得嵌入,以预测蛋白质结构、功能、细胞位置、水溶性、膜结合性、保守区和可变区等。
通过 AI 和加速计算,可针对刚性蛋白质靶标对数百万种候选药物进行筛选。AutoDock 是一系列不断增长的用于计算对接和虚拟筛选的方法,用于基于结构的药物研发和对生物分子结构基本机制的探索。
Clara Discovery 经过优化,可基于 NVIDIA DGX™ A100(非常先进的 AI 系统,可提供 5 petaFLOPS 的性能)运行。DGX A100 专为各种大规模加速计算工作负载而打造,可帮助研究人员更快地解决问题,并为 IT 提供统一的、易于部署的基础设施,以支持新一代药物研发。