含能材料(Energetic Material)是一类含有爆炸性基团或含有氧化剂和可燃物、能独立进行化学反应并输出能量的化合物或混合物,是炸药、发射药、推进剂和烟火剂配方的重要组成部分。
图 | 来源于网络
由于含能材料的特殊性以及人们对其要求的不断提高,实验研究、理论研究等传统研发模式已经有所局限。随着计算能力与大数据技术的不断发展,人工智能特别是机器学习、深度学习等技术在含能材料研发领域的应用潜力不断被发掘。
图 | 含能材料基本参数与宏观性能
以炸药研发为例,由于技术方面的局限,当前我国更侧重宏观性能的表征,微观结构与材料静态、动态性能间的关联考虑较少,因此建立起的性能表征方法尚不够全面。另一方面,在炸药性能预估时,更多采用国外的计算模型,因缺乏基础参数,其结果难以准确可靠地反映我国炸药的性能。那么,如何建立更加精准可靠的模型呢?除了依赖物理、化学、力学学科的研究基础,采用先进的数据融合与清洗技术,梳理清数据之间的关系,快速找出关键参数,并得到大量优质数据,是后续借助机器学习等技术建立精准AI模型的关键。
图 | 传统含能材料研发数据处理方式VS科学数据基因组
在对含能材料研发数据进行处理的过程中,传统的数据处理方式往往面临如下困难:
痛点一:如何轻松实现多源数据的整合与共享
在探究含能材料化合物结构与机械性能、灵敏度等宏观性能间的关系时,往往需要多源数据的支撑。比如化合物的结构及筛选一般通过外源数据库来实现;冲击灵敏度一般采用落锤冲击试验来测定,此部分数据归属测试部门;而机械性能的部分测试则由研发部门的模拟专家通过分子动力学模拟来实现。数据来源多样,格式差异大,导致数据清洗与融合的难度非常大,数据分析与处理工作对于专注研发的化学家们来说是件非常头痛的事。
这时,我们可以利用科学数据基因组SDH将来自不同部门、不同数据源的化合物结构、体积模量以及冲击敏感度数据进行清洗抽提、匹配融合,形成一目了然的统一数据视图。
图 | SDH支持多种数据源的接入
图 | SDH中的数据清洗:通过转换工具形成转换规则,可实现一键清洗转换
图 | 将化合物结构、体积模量以及冲击敏感度数据通过锚点进行关联
痛点二:如何轻松建立在线实时的全局性数据模型
传统的数据处理方式中,研发人员需要定期对阶段性的实验数据进行处理与分析,由于每次手动建立的数据模型存在时效及离线的属性,数据无法自动更新,导致每次数据处理的工作量非常大,所获得的经验也存在一定局限性。
这时,我们可以利用SDH科学数据基因组平台,根据业务逻辑建立起含能材料大数据基因组,当有新数据产生时,数据库自动刷新,帮助研发人员建立在线实时的全局性数据模型,快速准确地找到关键参数。
图 | SDH中含能材料数据基因组的建立(树状图&旭日图)
图 | SDH支持结构式呈现与子结构式筛选
图 | SDH数据分析:数据可视化
痛点三:如何建立精准可靠的计算模型与AI模型
含能材料在性能测试与表征过程中,因缺乏基础参数难以建立可靠的计算模型来描述。
在科学数据基因组平台SDH中,多源异构数据经过清洗与融合,可以帮助研究人员快速梳理出关键影响参数,并且经过清洗后的高质量数据可更有效地进行机器学习建模,从而建立精准可靠的计算模型与AI模型,指导实验研究。
SDH中经过清洗与融合的数据可直接导入分子模拟与人工智能平台MaXFlow中进行分子动力学模拟与机器学习建模。
图 | MaXFlow分子动力学工作流
图 | 模拟结果与体系平衡模
图 | 机器学习工作流
图 | log2(h50)与体积模量参数的相关性排序
因此,借助科学数据基因组平台SDH、分子模拟与人工智能平台MaXFlow共同构筑的智能研发引擎,含能材料研发机构可以高效地将分散数据总结为知识与经验,建立起核心数据资产,全面提升研发效率。