365股票网 - 股票资讯综合门户

您的位置:首页 >财经 >

“几何构象增强AI算法”,百度生物计算最新研究成果登上《Nature》子刊

时间:2022-02-23 16:23:44 | 来源:新浪证券

日前,国际顶级学术期刊《Nature》子刊《Nature Machine Intelligence》在线发表了百度在生物计算领域的最新研究成果《Geometry Enhanced Molecular Representation Learning for Property Prediction》,论文提出“基于空间结构的化合物表征学习方法”,即“几何构象增强AI算法”(Geometry Enhanced Molecular Representation Learning,GEM模型),将化合物的几何结构信息引入自监督学习和分子表示模型,对化合物进行“3D建模”,以预测化合物分子的性质属性。其在药物筛选上的应用,可在数小时内完成传统仿真方法1年的工作量,效率提升上千倍,有望大幅降低药物研发的时间投入和成本投入。该工作为百度在AI赋能药物研发领域的又一项重磅成果。

作为药物研发的关键一环,候选化合物的性质预测相当于为临床实验“排雷”,即提前筛选掉毒副作用高、人体吸收代谢不好等具有不良特性的化合物。这项任务以前只能通过传统仿真实验进行,成本高昂且耗时长。后来,研究人员引入深度学习技术,但传统的深度学习方法大多基于序列或者2D图结构建模,缺乏化合物三维空间结构信息的利用,这会丢失一部分空间信息,导致化合物性质预测结果的偏差。

实际上,化合物的性质和其三维空间结构密切相关,为了更好地预测化合物性质,亟需引入化合物的三维空间信息。百度此次提出的“基于空间结构的化合物表征学习方法”,即GEM模型,在这一点上实现了重大突破,在全球范围内开创性地将化合物性质预测从“2D建模”推进到“3D建模”。同时,引入AI领域迅速发展的预训练技术,利用大量无标注的化合物数据,通过自监督学习,构建GEM模型的底层能力,有望能成为小分子药物研发领域的模型底座,解决小分子药物活性预测,成药性预测,药物设计等核心问题,真正加速药物,特别是全新药物(First In Class)的发现过程。

GEM模型已基于百度飞桨生物计算平台螺旋桨PaddleHelix在GitHub开源:

https://github.com/PaddlePaddle/PaddleHelix/tree/dev/apps/pretrained_compound/ChemRL/GEM

基于空间结构的化合物表征学习方法(GEM)的整体框架

从实验效果看,百度GEM模型已在14个国际学术界公认的应用任务数据集上达到业界最佳,超越斯坦福等国际学术界、工业界的模型效果(后附效果图)。这些数据集包括:抑制 HIV 艾滋病病毒复制能力的数据集、小分子的生物活性数据集、血脑屏障渗透数据集等。百度GEM模型在回归任务上相对现有方法指标提升8.8%,在分类任务上指标相对提升4.7%,并在自监督学习方法上的消融实验中证明了自身的有效性。

部分实验结果截图

在应用价值层面,百度GEM模型可高效学习化合物的空间结构知识,并自主推断出空间结构信息,从而准确预测候选化合物的吸收、代谢、毒性等特性,帮助药物研发更快更准地完成早期筛选,目前已经在多个合作伙伴的研发管线中实现了商业化落地,有望通过AI技术探索双靶点抑制剂新的研发范式,为癌症病人和自身免疫性疾病病人提供更有效的治疗药物。

此外,该方法还有助于高效测量药物-靶标相互作用,可加速新药研发,为老药发掘新用途,并探索多种药物联合使用,进一步增强疗效,降低抗药性和毒副作用,甚至疗治新病症。

百度研究院在其发布的2022科技趋势预测中指出,基于AI的生物计算仍将高速发展,基础研究和应用场景协同创新将实现新突破。事实上,在生物计算领域,百度已全面布局并持续发力:推出业界首个mRNA疫苗序列设计算法,可在10分钟内找出稳定的疫苗序列,并与中国疾控中心开展合作;基于飞桨打造生物计算平台“螺旋桨PaddleHelix”,为生物医药专家与学者提供AI+生物计算的模型工具和解决方案,服务于新药研发、疫苗设计、精准医疗等场景。

据悉,本次研究由百度螺旋桨PaddleHelix团队独立完成。基于百度长期AI技术积累,团队成功实现了生物学与计算机科学的跨学科创新。百度此次提出的方法可为化合物成药性预测、小分子药物筛选、药物联用等具体场景的应用研究带来裨益,而未来更有望扩展到蛋白领域,构建基于蛋白的表征模型,服务于大分子的药物研发。

注:《Nature Machine Intelligence》是Nature旗下专注于机器学习领域的顶级期刊,主要刊发机器学习领域学术价值高并取得重大进展的研究论文。过去两年影响因子为16.649,一般计算机领域的顶会影响因子在3~10,影响因子值越高研究的影响力越大。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。