人工智能、大数据等技术的不断进步,为科研领域带来了新机遇。在材料科学领域,科学家们正在以前所未有的速度生产着数据…一些新理念、新方法,如材料基因组、高通量材料制备表征等,使材料科学研发效率大幅提升。人工智能赋能材料科学,有望为材料科学带来范式化革命,即通过数据方式高效指导材料研发路径,从而提升效率,降低成本。
上一期中,我们一起回顾了石油化工及材料设计领域四位科学家的精彩分享,领略了分子模拟与人工智能为科研领域所带来的深刻影响,今天我们将一起回顾材料科学领域三位致力于人工智能算法研究的科学家在大会上带来的精彩报告。
(注:以下内容按报告人出场顺序整理)
中国科学院金属研究所陈星秋研究员
中国科学院金属研究所陈星秋研究员的报告题目是《计算与数据驱动的拓扑声子材料》。陈星秋研究员首先介绍了拓扑声子材料的研究背景,他谈到,声子是凝聚态物质中最常见的粒子之一,是晶格振动的能量量子化的体现,与材料的热学、光学、电学和力学等基本物性密切相关。2017年以前,从拓扑绝缘体,拓扑半金属到拓扑超导,拓扑电子材料的研究引领了前沿,关于固体材料的拓扑声子尚未研究,而拓扑声子研究面临着诸多挑战。
陈星秋研究员介绍,团队在推导出的声子类薛定谔方程的基础上建立了拓扑声子理论,开发了拓扑声子计算软件包——TPHONON,并进行了大量新物态的预测。之后设计研发出高通量计算与大数据技术相互融合和迭代的拓扑声子材料计算算法和软件HT-PHONON,从13000多个材料中筛选出5014个拓扑声子材料,并对拓扑声子材料进行分类,实现了在线拓扑声子数据的通用化、便捷化和可视化,建成了拓扑声子材料数据库,数据库中包含了该工作的5014个材料共30多万条数据。陈星秋团队的工作实现了大数据驱动的拓扑声子新物态,设计了一系列理想的拓扑声子材料,推动了该领域的发展。
上海交通大学孙淮教授
上海交通大学化学化工学院孙淮教授的报告题目是《从第一性原理计算获得力场参数的自动化流程》。孙淮教授谈到,力场可以有力地提高分子模拟的时间和空度尺度,在计算化学中具有不可替代的作用,但力场方法也是一件令人生畏的事物,这是因为力场是一个用来预测势能与分子结构关系的回归模型,任何形式的回归都不可避免地受约于用来回归的数据,加上力场中用到的经验方程不能完全描述所有的科学现象,因此力场的可靠性及迁移性是有限的,超出其设计的应用范围,研究人员发现拓展或开发新的力场是有必要的。
近年来获得高速发展的机器学习显示通过大数据可以成功地建立极为复杂的回归模型。同时量子力学和统计力学计算方法的发展也提供了从理论计算获得大量数据进而建立力场的可行性。亟待解决的问题是如何生成适当的大数据并从中获得力场参数,孙教授在报告中提出了自动化工作流程方法来解决这一问题。目前该力场已经集成到创腾科技MaXFlow科学人工智能创新平台中,为致力于该领域的科学家提供更多便利!
该自动化工作流程的主要功能是:A)构建可以代表目标分子且适合用来参数化的分子片段;B)用量化计算在分子势能超曲面上采样并生成大量数据;C)用最小二乘法非线性回归构建力场模型;D)用分子动力学模拟拟合液体的物理性质来优化力场参数。工作流可以自动批量执行,既可以用来创建在科研中遇到的具有特定目标的力场,也可以创建一个具有一定覆盖面的通用力场。孙淮教授在报告中结合生命和材料科学中的实际案例介绍了该自动化工作流程,并详细讨论了其优势和局限性。
西安交通大学丁向东教授
西安交通大学金属材料强度国家重点实验室丁向东教授的报告题目是《机器学习辅助理解复杂结构相变》。在报告中,丁向东教授首先介绍了复杂结构相变的研究背景与挑战,他谈到基于第一性原理的分子动力学模拟方法更适合描述复杂体系的相变,而近几年研究发现,单纯用分子动力学模拟的方法描述更加苛刻的实验条件以及具有复杂原子运动的高压下融化相变过程是比较困难的。随着人工智能技术的发展,将机器学习、第一性原理、分子动力学相结合开发出比较准确的势函数来进行较大时间、空间尺度的分子动力学计算已经成为当前的趋势。
丁教授介绍了基于先验知识的机器学习势函数的构造过程,与传统机器学习相比,该方法的优势在于保持了物理约束关系(ENERGY&FORCE),可实现反馈学习,保证了应用效果,并且数据量少,训练效率高。介绍了如何基于深度学习框架来寻找影响宏观性能的微观热点事件,构建了基于自变分编码器+循环神经网络的深度学习模型,基于提取潜变量有效分析微观动力学过程。报告中,以金属K,Zr等为例,利用拟合得到的势函数进行了分子动力学模拟,预测了相关材料在高温高压等条件下的奇异特性,证明了机器学习与神经网络混合的方法的可行性和有效性。
丁向东教授团队采用机器学习与实验以及计算相结合,寻找描述复杂过程的潜变量来理解复杂相变机制,探索新奇相变现象,从而加速新材料的发现。