北 京 大 数 据 研 究 院
BEIJING INSTITUTE OF BIG DATA RESEARCH

AI4S繁荣生物计算、药物设计新前沿 | 科学智能峰会专家观点总结

“AI for Science”作为科研范式的重大改变,给生命科学机理探索和药物研发带来变革性的洞见和视角的同时,也带来更丰富的研究工具和研究方法。以计算生物、计算机辅助药物设计(CADD)、AI药物发现(AIDD)为代表的计算驱动手段相继在生物机理的探索、靶标发现和精准医疗、药物发现与设计等领域取得了显著的进步。AI4S与生物计算分论坛,聚焦探索AI与生命科学、药物研发的深度融合,报告嘉宾在蛋白质从头设计、CADD与AIDD中结构数据的有效利用、蛋白复合物结构预测模型的完全开源、AI赋能医药研发、新药设计的挑战与机遇等AI for Life Science前沿领域进行了分享。AI4S与生物计算分论坛,进一步加快AI4S在生命科学的扩散,加深生命科学领域的科学家、工程师对AI4S的理解和认知,催化AI4S与生命科学、生物计算的迅速融合。


AI与物理模拟融合,计算与实验结合,加速特异性结合蛋白的设计

曹龙兴|西湖大学生命科学学院研究员

蛋白质-蛋白质相互作用在几乎所有基本的生命过程中都起着关键作用。设计能够与天然蛋白质特异性结合的蛋白质在开发药物和新诊断工具中有巨大潜力。来自西湖大学生命科学学院的曹龙兴研究员,开发了一种蛋白质从头设计新方法,可针对自然界中的任意蛋白质的特定靶点设计结合蛋白。这种方法除目标的三维结构外,不需使用任何其它信息。该计算流程结合了物理模型和AI算法,并与从头蛋白设计的实验工作流完美融合。使用该方法,曹龙兴及其同事针对12种重要的自然界蛋白质靶标设计了结合蛋白,这些蛋白质靶标具有截然不同的表面形状和物理化学特性。生物物理实验验证表明,这些结合蛋白非常稳定,能够以纳摩尔至皮摩尔级的亲和力结合其靶标。对于其中所获得的五种复合物晶体结构,其计算模型与晶体结构完美匹配。在新冠疫情大流行期间,曹龙兴及其合作者成功对蛋白抑制剂进行从头设计,使其能够以皮摩尔级亲和力与新冠病毒刺突蛋白结合并阻止病毒感染细胞。

深势科技DPTechnology
,赞5

利用结构生物学数据提升CADD、AIDD的精度及效率

黄晶|西湖大学生命科学学院特聘研究员

计算机硬件和软件的最新进展使得计算机辅助药物设计(CADD)和人工智能药物设计(AIDD)越来越强大。与此同时,归因于结构生物学技术的进步,PDB数据库中可用的蛋白质-配体结构的数量大幅增加,这些复合物结构中包含了丰富的3D相互作用信息,如何利用这些数据和信息来加速CADD、AIDD的应用,成为众多学者在思考的重要研究课题之一。来自西湖大学生命科学学院的黄晶特聘研究员,长期致力于开发复杂体系的计算模型和模拟算法,以提升分子模拟和药物设计的精度和效率。本次论坛中,黄晶博士,分享了蛋白-配体结构信息充分有效利用在分子对接、分子生成模型框架中的应用实例。通过将结构信息融入CADD、AIDD,黄晶及其课题组成员分别开发了增强虚拟筛选方法EViS,以及基于D-MPNN神经网络的分子生成方法。EViS是典型的基于物理模型的CADD方法,有效融入蛋白-配体结构信息后,该虚拟筛选方法在富集率上达到同类方法的顶尖水平。

深势科技DPTechnology
,赞5

蛋白复合物结构预测方法Uni-Fold及其开源形态

柯国霖|深势科技机器学习算法负责人

DeepMind推出的AlphaFold2,在多数单体结构预测中首次达到与实验误差接近的准确性。前不久,DeepMind对外发布,研究人员使用AF预测了100万个物种体内约2亿个蛋白质的结构。AlphaFold2的出现深刻影响了蛋白结构预测以及相关的领域,并已经成为AI4S在蛋白质结构预测乃至生命科学领域的全球代言。然而对绝大多数研究者而言,复现、优化与改造这一模型不仅极为困难,AlphaFold2在蛋白质复合物预测方面的精度也有待进一步提升。来自北京深势科技机器学习负责人柯国霖,分析了当前AF2在蛋白复合物预测方面遇到的挑战,并针对这些挑战逐一给出了算法解决方案,所有的优化结果最终收敛和凝聚在最新版本的Uni-Fold中。柯国霖及深势科技团队升级并开源了Uni-Fold的最新代码与模型参数,完整支持蛋白质单体、复合物结构预测模型的推理与训练并在最新公开、去重的PDB结构数据上达到更优精度。通过多项效率优化,在同等硬件与相同模型配置下,Uni-Fold加速AlphaFold训练约2.2倍,超越OpenFold、FastFold等方案,是目前已知的最高效的实现。

深势科技DPTechnology
,赞8

人工智能在生命复杂体系多尺度不同时空效应的应用展望及实例分享

宋乐|百图生科首席AI科学家

AI(人工智能)应用于药物研发已经在全球范围内引起研究院所和制药行业高度重视,AI开始赋能药物研发的靶标发现和确证、药物先导化合物的发现和优化、药物药代和毒性评价等各个阶段,将成为未来药物研发的关键核心技术之一。如何将人工智能(AI)药物研发新范式应用于药物研发领域是制药行业以及很多AI制药企业一直以来探索的革新方向。来自百图生科首席AI科学家宋乐博士,分析了目前AI应用的三大挑战:复杂体系多尺度不同时空效应的调控网络、生命复杂体系不同截面的数据融合、AI模型与生物实验的闭环周期过长。针对这些挑战,宋博士分享了百图生科的解决方案:高通量实验与AI模型全闭环融合的干湿结合系统,并分享了AI在靶点发现(整合多组学数据构建知识库)、AI在药物优化(蛋白结构预测、RNA结构预测、分子性质预测、分子生成、逆合成、分子优化)方面的方法和成功应用。

深势科技DPTechnology
,赞4

蛋白动力学形态下的药物分子设计

朱维良|中国科学院上海药物研究所

药物发现与设计中心主任

蛋白质结构总是运动的、靶点的结合位点是相互关联的、药物-靶标结合时动态的、分子间作用力是复杂的。虽然计算机辅助药物设计CADD已经成为创新药物研究不可或缺的理论工具,但方法的通用性及准确度仍然不能满足实际需求。目前CADD面临着包括靶标蛋白质的构象采样不充分且效率不高、药物结合位点的动态特征难以描述、难以准确计算靶标-药物结合的热力学及动力学参数等一系列挑战。来自中国科学院上海药物研究所药物发现与设计中心主任朱维良研究员,就如何针对“不断运动变化的靶点蛋白设计出活性强的药物分子”这一命题,采用基于物理模型的分子模拟方法和药物设计思路,介绍了课题组多年来在分子动力学模拟及增强采样、受体-配体自由能计算、药物-靶标间的相互作用的积累沉淀和研究成果。同时,朱维良研究员也就人工智能在药物发现的未来应用方向和领域做了简要的分析和预测。

深势科技DPTechnology
,赞2

蛋白质设计:从能量到AI的进化

周耀旗|深圳湾实验室系统与物理生物学所

资深研究员

设计新蛋白质、执行新功能是合成生物学的一个重要课题。尽管取得了许多成功,从头蛋白质设计的成功率仍然很低,还没有真正被解决。成功率低的一个主要原因是我们还没有准确的能量函数来描述蛋白质链中氨基酸残基之间、溶剂介导的相互作用。来自深圳湾实验室系统与物理生物学所资深研究员周耀旗博士,详细分享了其课题组在能量函数与蛋白质设计方面的相关工作——OSCAR-Design。结果表明,OSCAR-Design在序列、物理化学特征上的指标类似或者好于同类软件。与此同时,伴随着AlphaFold2在高精度蛋白质结构预测上取得了革命性进展。周博士也分享了AI在蛋白质设计方面的思考,AlphaFold2的成功表明:能量函数的作用完全可以在神经网络内部实现,而神经网络里几乎无限量的参数,与几十或者几百人工经验参数的经典力场或者经验能量函数相比,有更好的能力来拟合复杂的、蛋白质内部的相互作用。

深势科技DPTechnology
,赞6

关于AISI

北京科学智能研究院(AI for Science Institute,Beijing,以下简称AISI)成立于2021年9月,由鄂维南院士领衔,致力于将人工智能技术与科学研究相结合,加速不同科学领域的发展和突破,推动科学研究范式的革新,建设引领世界的「AI for Science」基础设施体系。

AISI的研究人员来自国内外顶尖高校、科研机构和科技企业,共同聚焦物理建模、数值算法、人工智能、高性能计算等交叉领域的核心问题。

AISI致力于创造思想碰撞的学术环境,鼓励自由探索和跨界合作,共同探索人工智能与科学研究结合的新可能。


加入我们

AI for Science Institute(AISI) 招人啦|快来pick你心动的职位