在上一期中,我们一起回顾了材料科学领域三位专家在人工智能算法研究领域的精彩报告,今天,跟大家见面的是来自生命科学领域致力于AI算法开发方面的三位专家:药明康德新药开发有限公司高级主任王正、浙江大学药学院教授侯廷军、中国科学院上海药物研究所研究员郑明月。
(注:以下内容按报告人出场顺序整理)
药明康德新药开发有限公司高级主任王正
药明康德国内新药研发服务部(DDSU)王正主任的报告题目是《AI技术在化学逆合成中的应用——DeepSyn》。报告中,王正主任介绍了化学逆合成的发展历程,提到有机合成大师埃里亚斯·科里(Elias Corey)于20世纪60年代首次提出反合成设计的思想,并据此设计了第一个初步实现计算机辅助分子合成设计(CASP)软件。1990年,科里教授由此获得了诺贝尔化学奖。2006年以后该领域开始引入AI技术。
接下来,王正主任介绍了CASP主要算法和应用场景,指出逆合成推算是其中一个比较重要的应用场景,并认为药物的不同研发阶段对逆合成的需求不同。药明康德通过对现有AI逆合成软件做大量测评之后,认为现有AI逆合成软件在实际应用中还无法达到合成专家的标准。药明康德通过尝试实现各种CASP方法,并对这些方法进行了系统地分类与深入研究,总结出药明康德CASP路线设计框架,开发出了内部基于AI技术的逆合成软件。最后介绍了AI逆合成在药明康德的实际应用,取得了良好效果。
浙江大学药学院教授侯廷军
浙江大学药学院侯廷军教授的报告题目是《蛋白-蛋白打分方法研究及预测系统开发》。侯廷军教授首先介绍了团队在MM/GB(PB)SA对蛋白-蛋白对接重打分精度的评测研究方面的工作。随后介绍了高效蛋白-蛋白打分方法HawkRank的开发思路以及HawkDock在线计算平台的开发原理与过程,根据CASP14-CAPRI结果显示,HawkDock取得了比较理想的表现。侯教授介绍,目前HawkDock在线计算平台已有访问量86000余次,运行量52000余次,并且在很多相关领域课题组中得到应用。
接下来,侯教授介绍了课题组开发的程序和软件/平台,主要涉及分子结构处理及表征、自由能预测和活性分子筛选、成药性和安全性评价、生物医药数据库等几种类型。最后介绍了课题组在AI算法方面正在开展的几项工作,包括完备而高效的信息表征建模一体化平台——BioMedR、全自动靶点-配体打分函数构建和筛选一体化平台—— ASFP、计算生物谱CBFP方法以及HRGCN+方法、成药性和毒性预测平台ADMETlab 2.0等。
中国科学院上海药物研究所研究员郑明月
中国科学院上海药物研究所研究员郑明月的报告题目是《分子生成模型和药靶预测》。报告中,研究员郑明月围绕分子生成模型和药物靶标相互作用预测两个方面的工作进行了详细介绍。在介绍分子生成模型时,研究员郑明月谈到利用深度神经网络的表示学习能力,学习、推断分子结构的概率分布,或者分子和性质的联合概率分布,可生成具有变化的新数据(分子)。并介绍了常用的分子深度生成模型以及基于深度生成模型的p300/CBP抑制剂设计优化,总结了深度生成模型存在的诸多分子挑选问题以及所采取的优化手段。
研究员郑明月谈到,药物靶标相互作用预测是药物研究的核心和难点问题。在报告中比较了预测CPI的三类方法(基于配体信息预测、基于蛋白三维结构预测、基于蛋白序列信息预测),并认为Proteochemometric modeling(PCM)由于只需要分子和蛋白质的序列信息,应用范围广泛。
接下来,研究员郑明月介绍了基于蛋白序列信息CPI模型存在的问题并提出了相应解决方案,介绍了如何基于序列信息预测药物作用靶点以及基于转录组数据预测药物作用靶点。最后得出结论:分子生成模型的目标导向优化和分子挑选问题是难点;常用的分子性质预测和对接打分模型准确性有待提高;药靶预测模型核心是学习提取相互作用特征,容易受到ligand bias的影响;药物设计中深度学习模型的可解释性和不确定性定量问题值得关注。