北 京 大 数 据 研 究 院
BEIJING INSTITUTE OF BIG DATA RESEARCH

深势科技 DP Technology:Uni-FEP上线公测——旧时王谢堂前燕,飞入寻常百姓家

本文转载自微信公众号:深势科技 DP Technology


Hermite,是深势科技推出的根植于云计算的临床前计算机辅助药物设计(Computer Aided Drug Design, CADD)平台,致力于为药物研发工作者提供在CADD中数据、算法、算力三位一体的一站式解决方案。


Uni-FEP是Hermite最新推出的药物结合自由能计算模块,将自由能微扰理论、分子动力学、增强采样算法与高性能计算相结合,能够以化学精度高效评估蛋白质与配体的结合亲和力,实现工业规模的先导化合物优化。


自由能微扰方法
评估蛋白配体结合亲和力的计算方法
在众多理化性质中,与靶点蛋白有较高的结合亲和力是配体分子能够成药的必要条件。过去二十年来,分子对接(Docking)[1]得到了广泛的应用,其有能力进行千万级别分子数据库的筛选,但打分函数不准确以及采样不足限制了这种方法的精度,因此其多应用于粗筛阶段得到苗头化合物。相较之下,自由能微扰方法(Free Energy Perturbation, FEP) [2] 严格基于统计物理和分子动力学,可以对结合位点构象变化进行有效采样,从而精准评估蛋白与配体的结合自由能。

顾名思义,自由能微扰方法即为当某种物理状态受到轻微扰动,我们可以计算其前后状态间的自由能差值。一般扰动越小计算的精度越高,当两种状态差别较大时,我们可以插入一些中间状态,求和两两状态间差值从而得到端点间的自由能差。当我们希望比较分子A和分子B与蛋白的结合自由能ΔGAΔGB的大小时,对其的直接计算(图1垂直线)称为绝对自由能计算。鉴于自由能是状态函数,我们可以设计如下图的热力学循环,转而计算A和B分别在与蛋白形成的复合物以及溶解在水中的自由能差ΔG1ΔG2(图1水平线),这种方法称为相对自由能计算。相比绝对自由能计算,相对自由能计算的两端结构更相近,因此其计算收敛所需的模拟时间更短,计算精度也更高。[3-5]

1.jpg
图1:相对自由能计算的热力学循环[5]借助Hermite平台作图

FEP可达化学精度
有效指导先导化合物优化
FEP是目前公认精度最高、迁移性最好的亲和力评估计算方法。FEP对结合自由能的预测值与实验结果的误差可以接近化学精度(1 kcal/mol,约5-6倍活性差异以内)[6],远远高于对接打分的预测精度。相较于将候选分子全部实验合成并采用SPR等手段严格测量亲和性,使用FEP方法预测结合亲和力的速度和成本都显著更优。

FEP一个典型的应用场景是在先导化合物优化阶段将微摩级别活性分子改造,将活性提升至纳摩级别:经过药物化学家对先导化合物的侧链基团或部分骨架进行改造,有数十/百个活性可能增强的分子被设计出来,此时的目标是从中挑选出活性最高的分子。将分子全部实验合成的方法成本过高、周期过长,如果使用通用对接打分函数等低精度的方法挑选有更大可能漏选高活性分子,而使用FEP方法可以在不牺牲精度的同时显著降低成本、缩小设计周期,指导先导化合物优化。在评估蛋白配体结合自由能基础上,FEP亦可应用于配体对同族蛋白选择性预测、蛋白突变稳定性预测、保持亲和力的同时修饰化合物以改进ADME/T性质等场景。

Uni-FEP
深势科技自研FEP完整解决方案
虽然FEP的算法理论早在20世纪末便已被提出[7],但囿于其背景知识要求高、准备模拟流程繁杂、消耗计算资源庞大、现有其他商业软件价格高昂等原因,时至今日一位普通药物研发从业者想要应用FEP方法仍然相当困难。Uni-FEP是深势科技自研的FEP完整解决方案,它将自由能微扰理论、分子动力学、增强采样算法与高性能计算相结合,能够以化学精度高效评估蛋白质与配体的结合亲和力。

Uni-FEP现已在深势科技推出的药物设计平台Hermite中上线,提供用户友好的端到端使用体验,助力工业规模的先导化合物优化。

性能强大,高效准确

Uni-FEP始终致力于提升计算的精度、速度与应用场景。我们结合了二维拓扑信息以及三维结构信息设计了自动构建成对配体之间的原子映射算法;计算结合自由能需要对蛋白与配体构象进行充分采样,因此我们基于分子动力学引擎GROMACS[8]实现了增强采样算法(溶质加热副本交换,REST2[9-10]);我们亦使用了统计方法优化了计算微扰图的设计与回归分析;同时我们对软核相互作用等众多模拟参数进行了调优。我们还在开源软件GROMACS基础上进行了系统的GPU高性能计算优化,使得推荐参数下的单次FEP计算能够在10-15小时内完成,而根植于云计算的Hermite平台一天可以进行成百上千次FEP计算。

我们选用了Schrödinger公司发表论文中的数据集进行Uni-FEP的精度验证,其中包括多种类型靶点,如蛋白酶、激酶、抗凋亡蛋白等,总计8个靶点和199个小分子[6]。我们比较了三种方法对蛋白配体结合能的预测值与各自实验值的相关性,测试结果见图2。R²越高代表计算与实验值越相关,整体而言Uni-FEP在案例中与Schrödinger FEP+方法表现出了相当的精度,并且明显优于基于Vina软件的打分函数方法。
2.jpg
图2:Hermite Uni-FEP及其他两种方法在公开数据集[6]的验证结果,R²为蛋白与配体的结合自由能的实验值(ΔGexp)和FEP预测值(ΔGFEP)之间的决定系数,它们由成对配体之间的相对自由能ΔΔG回归分析得到。

相比以R基团替换为主的上述体系,真实的药物研发场景中存在更多复杂情形。比如进行骨架跃迁(开/闭环、扩/缩环、扩/缩链)前后的自由能计算是常见需求,我们实现了“软键”相互作用,并在6个曾以骨架跃迁策略获得临床候选药物的不同靶点体系[11] 完成计算验证,计算结果见图3。
3.jpg
图3:Hermite Uni-FEP在公开数据集[11]上的验证结果。N为FEP计算的总数,RMSE和R²为相对结合自由能的实验值(ΔΔGexp)和FEP预测值(ΔΔGFEP)的均方误差(单位kcal/mol)和决定系数。

2020年,Schrödinger与Merck KGaA联合展开了对自由能计算方法的评估[12],将其应用于多个内部药物设计项目进行前瞻性研究,配体的改造涵盖骨架跃迁、净电荷变化等富有挑战性的场景,如tnks2的配体涉及净电荷变化与骨架跃迁(见图4)。我们的测试发现Uni-FEP结果良好。
4.jpg
图4:Hermite Uni-FEP在公开数据集[12]上的验证结果。N为FEP计算的总数,RMSE和R²为相对结合自由能的实验值(ΔΔGexp)和FEP预测值(ΔΔGFEP)的均方误差(单位kcal/mol)和决定系数。

流程自动,操作便捷

软件工程助力算法落地。我们以网页应用的形式在Hermite药物设计平台中将Uni-FEP呈现给用户,用户无需考虑自己电脑的性能高低、存储大小;也不必担心自己的操作系统是否适配;亦不需进行繁琐的安装操作;只要打开浏览器键入网址,就可以流畅地在最新版Uni-FEP中设置自己的FEP作业。用户的最新修改会实时保存,从而可以随意在多个终端之间自由切换。与此同时任何上线的最新功能可以在第一时间触达用户。Hermite内置作业调度系统,可以充分使用云端海量计算资源助力FEP计算,并且在用户提交任务后可以实时更新任务状态,在任务完成时以邮件形式通知用户。

Uni-FEP的主要流程可以简要概括为:
  1. 传蛋白与多个结构相近的配体
  2. 构建微扰图(见图5)。图中每一个节点代表一个配体分子,每条有向边代表一对自由能计算。Uni-FEP可以通过计算分子之间相似度为用户推荐如何构建微扰图,用户也可以根据经验指定要计算的边。
  3. 构建原子映射,Uni-FEP会根据分子的二维拓扑信息以及三维结构信息自动建立映射(见图6)。
  4. 指定分子动力学模拟参数,Uni-FEP 实现了从准备力场参数、平衡体系等的全自动工作流,指定参数后用户只需一键提交,便可等待任务结束得到结合自由能预测结果。

图片
图5:Hermite Uni-FEP软件微扰图界面

6.gif
图6:Hermite Uni-FEP软件原子映射界面

需求导向,快速迭代

7.jpg

图7: Uni-FEP研发历程


从2020年初的"一无所有只有信心"到今天Uni-FEP上线公测,我们走了不到两年的风雨兼程。我们经历过不分昼夜的公式推导与编码;我们实现了一个月内从零GPU编程基础到计算速度提升5倍的突破;我们费尽周折终于在第一家客户的自用机器上成功部署...... 我们想真挚地对一路上给予我们帮助的来自于学界与业界的伙伴们表示感谢。

最令我们激动的是在实践过程中一个个真实的问题促使我们一路回归到理论算法和算力的底层基础,激发新一轮的创新。当我们很早成功完成第一份8个体系的数据集验证时十分欣喜,但很快便发现如骨架跃迁、电荷变化、大环成环、共价体系、GPCR体系、Protein-FEP等更复杂情形等待挑战。同时我们也始终致力于结合机器学习与量子力学开发新一代生物力场提升模拟与计算精度[13-15]。所以我们相信今日只是起点,我们期望在一份份测试与反馈中,始终秉持用户需求第一的原则,不断改进Uni-FEP的性能。

探索微观,模拟未来
“工业软件代表着工业文明的最高形态,是数学、物理、化学、生物等自然科学知识,结合人类设计制造的实践,相互浸润长期磨合而成。”深势科技积极响应国家对十四五工业化软件“制造强国建设”的号召,在成立之初便决心立足底层算法与软件技术的结合突破。今天我们高兴地宣布药物设计结合自由能微扰软件Uni-FEP上线公测,“旧时王谢堂前燕,飞入寻常百姓家”,我们期望Uni-FEP 这样一款高效易用的软件可以在药物研发流程中做出贡献。我们诚恳地邀请各位专业人士进行测试与反馈。谢谢您的关注!

联系试用及参与Workshop
Hermite平台Uni-FEP功能现已开放公测,诚邀体验!为帮助您更好地了解平台功能特性、带来更好的应用体验,我们将分批开放测试。

我们将于北京时间2021年10月23日19:00-20:30举办Hermite Uni-FEP 线上Workshop,进行Uni-FEP的方法原理与软件实操的讲解。

如有意试用或加入Workshop,请您扫描下方二维码进群、填写问卷,我们将尽快与您联系、安排测试(如您已在深势科技Hermite相关测试群,无需重复进群)。

如二维码过期或达到人数上限,请在深势科技公众号后台回复 "Uni-FEP" 获取最新使用方式。
8.jpg

如需获取Uni-FEP产品技术支持,请邮件联系zhangyz@dp.tech, changjh@dp.tech 。

References

[1] Lengauer, Thomas, and Matthias Rarey. "Computational methods for biomolecular docking." Current opinion in structural biology 6.3 (1996): 402-406.

[2] Chipot, Christophe, and Andrew Pohorille. "Free energy calculations." Springer series in chemical physics 86 (2007): 159-184.

[3] Jorgensen, William L. "Efficient drug lead discovery and optimization." Accounts of chemical research 42.6 (2009): 724-733.

[4] Wang, Lingle, B. J. Berne, and Richard A. Friesner. "On achieving high accuracy and reliability in the calculation of relative protein–ligand binding affinities." Proceedings of the National Academy of Sciences 109.6 (2012): 1937-1942.

[5] Cournia, Zoe, Bryce Allen, and Woody Sherman. "Relative binding free energy calculations in drug discovery: recent advances and practical considerations." Journal of chemical information and modeling 57.12 (2017): 2911-2937.

[6] Wang, Lingle, et al. "Accurate and reliable prediction of relative ligand binding potency in prospective drug discovery by way of a modern free-energy calculation protocol and force field." Journal of the American Chemical Society 137.7 (2015): 2695-2703.

[7] Bennett, Charles H. "Efficient estimation of free energy differences from Monte Carlo data." Journal of Computational Physics 22.2 (1976): 245-268.

[8] Van Der Spoel, David, et al. "GROMACS: fast, flexible, and free." Journal of computational chemistry 26.16 (2005): 1701-1718.

[9] Wang, Lingle, et al. "Modeling local structural rearrangements using FEP/REST: application to relative binding affinity predictions of CDK2 inhibitors." Journal of chemical theory and computation 9.2 (2013): 1282-1293.

[10] Bussi, Giovanni. "Hamiltonian replica exchange in GROMACS: a flexible implementation." Molecular Physics 112.3-4 (2014): 379-384.

[11] Wang, Lingle, et al. "Accurate modeling of scaffold hopping transformations in drug discovery." Journal of chemical theory and computation 13.1 (2017): 42-54.

[12] Schindler, Christina EM, et al. "Large-scale assessment of binding free energy calculations in active drug discovery projects." Journal of Chemical Information and Modeling 60.11 (2020): 5457-5474.

[13] Zhang, Linfeng, et al. "Deep potential molecular dynamics: a scalable model with the accuracy of quantum mechanics." Physical review letters 120.14 (2018): 143001.

[14] Zhang, Linfeng, et al. "End-to-end symmetry preserving inter-atomic potential energy model for finite and extended systems." Advances in Neural Information Processing Systems (2018): 4441-4451.

[15] Zhang, Yuzhi, et al. "DP-GEN: A concurrent learning platform for the generation of reliable deep learning based potential energy models." Computer Physics Communications 253 (2020): 107206.



关于深势科技
深势科技有限公司(“深势科技”)是一家成立于2019年的科技公司,致力于以新一代分子模拟技术解决微观尺度工业设计难题。 以打造切实服务于药企、材料商和科研机构的模拟研发平台为主要业务方向,以解放研发工作者的生产力为主要业务目标。

深势科技具有强大的科研与产业落地能力。其新一代分子模拟算法在保持量子力学精度的基础上,将分子动力学的计算速度提升了至少五个数量级,且对算力的需求与体系的原子数量呈线性依赖;结合高性能计算,能够对数十亿原子规模的体系进行量子力学精度的计算模拟。团队核心成员获得2020年全球计算机高性能计算领域的最高奖项“戈登·贝尔奖”,相关工作当选2020年中国十大科技进展,以及2020年全球人工智能十大科技进展。