SDH案例 | 科学数据基因组在含能材料研发中的应用-创腾科技

科学数据基因组在含能材料研发中的应用

来源：SDH科学数据基因组平台

含能材料（Energetic Material）是一类含有爆炸性基团或含有氧化剂和可燃物、能独立进行化学反应并输出能量的化合物或混合物，是炸药、发射药、推进剂和烟火剂配方的重要组成部分。

图 | 来源于网络

由于含能材料的特殊性以及人们对其要求的不断提高，实验研究、理论研究等传统研发模式已经有所局限。随着计算能力与大数据技术的不断发展，人工智能特别是机器学习、深度学习等技术在含能材料研发领域的应用潜力不断被发掘。

图 | 含能材料基本参数与宏观性能

以炸药研发为例，由于技术方面的局限，当前我国更侧重宏观性能的表征，微观结构与材料静态、动态性能间的关联考虑较少，因此建立起的性能表征方法尚不够全面。另一方面，在炸药性能预估时，更多采用国外的计算模型，因缺乏基础参数，其结果难以准确可靠地反映我国炸药的性能。那么，如何建立更加精准可靠的模型呢？除了依赖物理、化学、力学学科的研究基础，采用先进的数据融合与清洗技术，梳理清数据之间的关系，快速找出关键参数，并得到大量优质数据，是后续借助机器学习等技术建立精准AI模型的关键。

图 | 传统含能材料研发数据处理方式VS科学数据基因组

在对含能材料研发数据进行处理的过程中，传统的数据处理方式往往面临如下困难：

痛点一：如何轻松实现多源数据的整合与共享

在探究含能材料化合物结构与机械性能、灵敏度等宏观性能间的关系时，往往需要多源数据的支撑。比如化合物的结构及筛选一般通过外源数据库来实现；冲击灵敏度一般采用落锤冲击试验来测定，此部分数据归属测试部门；而机械性能的部分测试则由研发部门的模拟专家通过分子动力学模拟来实现。数据来源多样，格式差异大，导致数据清洗与融合的难度非常大，数据分析与处理工作对于专注研发的化学家们来说是件非常头痛的事。

这时，我们可以利用科学数据基因组SDH将来自不同部门、不同数据源的化合物结构、体积模量以及冲击敏感度数据进行清洗抽提、匹配融合，形成一目了然的统一数据视图。