大连理工大学携手昇腾AI,共同孵化分子模拟大模型

2022-12-23 10:58:29爱云资讯

摘要:依托大连人工智能生态创新中心,为新药研发注入创新活力!

近日,大连理工大学计算机科学与技术学院申彦明教授团队携手昇腾AI,正合力打造基于图神经网络(Graph Neural Networks, GNN)的分子模拟大模型。该模型可广泛应用于生物分子性质预测、蛋白质-配体对接预测及药物设计等领域,帮助医药领域缩短药物研发周期、降低研发成本,推动研发进程。

分子模拟可以深入阐述分子之间的相互作用,通过与图神经网络技术相结合,可以充分利用大规模分子数据集和图神经网络模型的互补优势,建立“多尺度建模-图神经网络-大模型”的研究范式,在保证预测准确性的同时,提高计算效率,是科学智能的典型应用。

大连理工大学计算机科学与技术学院教授、博士生导师申彦明教授致力于图神经网络技术及其在生物分子领域的相关研究和产业应用。团队研发的图神经网络模型在国际权威的图数据评测数据集Open Graph Benchmark (OGB)中的蛋白质相互作用数据集ppa上排名榜首;在分子化合物数据集ZINC上排名第一;并在国际著名的数据科学竞赛KDD Cup 2021中,战胜谷歌DeepMind、百度、蚂蚁金服等多支队伍,夺得冠军。

2022年12月,在大连人工智能生态创新中心的支持下,大连理工大学申彦明教授团队将GNN算法迁移至全场景AI框架昇思MindSpore,并基于Atlas 900 AI集群加速训练效率,实现了对分子模拟大模型能力的进一步提升。该模型利用强表达能力的图神经网络方法建模生物小分子和蛋白质大分子,同时支持不同分子表示形式作为输入,支持分子模拟多种任务场景,如分子属性预测、蛋白质-分子对接位点预测、分子结构生成等。另外,模型的表达能力更优,对同构性高的分子结构具备更强的区分能力从而在各个级别的下游任务中取得SOTA性能。

分子模拟大模型的下游任务和关键技术

分子模拟大模型的孵化将大幅提升药物研究的效率与成功率,推动药物研发进程。下一步,大连人工智能生态创新中心将全力支持大模型落地产业相关应用:

应用一:生物分子性质预测

生物分子性质是药物研发过程中至关重要的因素,特别是在临床实验前的候选药物筛选阶段,需要考虑药物分子自身天然存在的水溶性、毒性、人体器官可吸收性等性质。

传统的实验方法通过生物体内实验对大规模分子库中数以万计的小分子筛选,导致研发周期长,生产成本高。分子模拟大模型可以直观地把分子建模为图,利用图神经网络实现分子的化学结构表征,保证精准预测的同时,加速药物发现进程。

小分子基团酸碱解离常数值的预测

应用二:蛋白质-配体对接预测

蛋白质往往是通过与其他生物分子或药物分子(配体)的相互作用来执行其生物学功能,对于药物研发而言,了解蛋白质-配体对接关系是了解小分子药物作用机制和潜在副作用的关键一环。

目前,只有约140种可用的蛋白质-配体复合结构,通过分子模拟大模型模拟蛋白质和配体结构,可以快速、准确地预测对接位点和对接方位,发现更多可用的蛋白质-配体复合结构。

将分子和蛋白质结构同时建模为图,更细粒度的可结合位点的预测

应用三:辅助药物设计

分子设计是药物发现过程中的关键,平均一款新药从研发到上市需要花费数亿资金。

相比于传统方法通过化学实验来筛选和验证药物分子,分子模拟大模型可以一种经济快捷的方式探索化学空间,得到具有特定性质的药物分子,从而加速药物设计过程、降低成本。

结合图神经网络和生成模型得到具有特定性质的药物分子

未来,大连人工智能生态创新中心将以澎湃算力和平台优势,支持大连理工大学分子模拟大模型的研发和产业落地,推动人工智能技术加速药物研发,为繁荣昇腾AI产业生态贡献力量!

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2022