数据少三个数量级,等变图神经网络在长时间 - 脑震荡

TUhjnbcbe - 2023/11/5 2:36:00

北京治疗白癜风的好医院 https://wapjbk.39.net/yiyuanfengcai/yyjs_bjzkbdfyy/

编辑/绿萝

分子动力学（MD）模拟是在能源存储、催化和生物过程等领域进行计算发现不可或缺的工具。在实践中，第一性原理方法的不利计算尺度将模拟限制在较短的时间尺度和较少的原子数。基于机器学习，特别是神经网络的原子间势能灵活模型的构建，有望从从头算参考计算中学习高保真势能，同时保留有利的计算效率。

近日，来自哈佛大学的研究团队提出了神经等变原子间势(NequIP)，这是一种E(3)等变图神经网络方法，用于从分子动力学模拟的从头算计算中学习原子间势。NequIP优于现有模型，训练数据减少多达三个数量级。该方法能够在长时间尺度上进行高保真分子动力学模拟。

该研究以「E(3)-equivariantgraphneuralnetworksfordata-efficientandaccurateinteratomicpotentials」为题，于5月4日发布在《NatureCommunications》上。

机器学习在原子间势研究中的第一个应用是建立在基于描述符的方法上，结合了浅层神经网络或高斯过程，旨在展示平移、相同化学物质的原子排列和旋转方面的不变性。

最近，旋转不变图神经网络原子间势（GNN-IPs）已成为一种强大的原子间势深度学习体系结构，它消除了手工制作描述符的需求，允许从几何数据的不变特征中学习原子图上的表示。

相比之下，NequIP使用相对位置向量而不是简单的距离（标量），不仅包含标量，还包含高阶几何张量的特征。这使得内部特征改为与旋转等变，并允许旋转等变滤波器使用角度信息。与其他方法类似，可以将卷积限制为所有其他原子的局部子集，这些原子比选定的截止距离rc更靠近中心原子。

图1：NequiIP网络架构。

本工作的贡献在于，在几何张量上构建了基于E(3)等变卷积的分子和材料的深度学习节能原子间势，从而产生了最先进的准确性和出色的数据效率，并且可以从分子动力学模拟中以高保真度再现结构和动力学特性。

NequIP网络架构

NequIP网络架构如图1所示，建立在原子嵌入的基础上，然后是一系列交互块，最后是输出块：

嵌入：在SchNet之后，使用可训练的嵌入生成初始特征，该嵌入仅对原子序数Zi（通过one-hot编码表示）进行操作，通过可训练的自交互层实现。交互块：交互块编码相邻原子之间的交互：该块的核心是卷积函数。产生相同旋转和奇偶校验对(lo,po)的不同张量积交互的特征由线性原子级自交互层混合。为交互块配备了ResNet样式的更新。最后，混合特征由等变的基于SiLU的门非线性处理。输出块：最终卷积的l=0特征被传递到输出块，该输出块由一组两个原子级自交互层组成。

对于每个原子，最后一层输出一个标量，它被解释为原子势能。然后将这些相加得出系统的总预测势能。随后获得力作为预测的总势能的负梯度，从而确保能量守恒和旋转等变力。

方法验证

研究人员在一系列具有挑战性的数据集上验证了所提出的方法：首先，证明该方法提高了MD-17（一个广泛用于基准测试ML-的有机小分子数据集IP）的最新精度。接下来，展示了NequIP可以准确地学习在量子化学CCSD(T)理论水平上在小分子上获得的力。为了扩大该方法在小的孤立分子之外的适用性，最后，探索了一系列具有周期性边界条件的扩展系统，包括表面和块状材料：不同相的水，固/气界面处的化学反应，无定形磷酸锂和锂超离子导体。

研究人员首先在MD-17上评估了NequIP。

表1：原始MD-17数据集上分子的能量和力MAE。

表2：修订后的MD-17数据集上分子的能量和力MAE。

研究发现NequIP优于所有其他方法。与sGDML和FCHL19/GPR相比，准确度的持续改进尤其令人惊讶，因为它们基于核方法，通常在小型训练集上获得比深度神经网络更好的性能。对旋转顺序l∈{0,1,2,3}运行收敛扫描，发现将张量秩增加到超过l=1会得到一致的改进。从l=0到l=1的显著改进突出了等方差在提高该任务的准确性方面的关键作用。

接下来，利用NequIP的高数据效率，在一组以量子化学精度计算的分子（CCSD的阿司匹林，CCSD(T)的所有其他分子）进行评估，并将结果与sGDML和GemNet报告的结果进行比较。

补充表1：CCSD/CCSD(T)精度下分子的能量和力MAE。

结果表明，NequIP可以准确地学习在量子化学CCSD(T)理论水平上在小分子上获得的力。

最后，为了证明NequIP在小分子之外的适用性，探索了一系列具有周期性边界条件的扩展系统，包括表面和块状材料：不同相的水，固/气界面处的化学反应，无定形磷酸锂和锂超离子导体。

作为第一个示例，使用由液态水和三个冰系统组成的联合数据集在PBE0-TS理论水平上计算。

表3：液态水和三个冰系统上的能量和力的RMSE。

研究发现，在训练数据减少倍的情况下，NequIP在力分量误差的数据集的所有四个部分上都显著优于DeepMD。

将NequiIP应用于催化表面反应。特别是，研究了甲酸盐在Cu表面上进行脱氢分解(HCOO*→H*+CO2)的动力学。

图2：基准系统。

在2,个结构上训练的NequIP模型在C、O、H和Cu四种元素上分别获得了19.9meV/、71.3meV/、13.0meV/和47.6meV/的力分量的MAE。从中发现平均力MAE为38.4meV/，在这四个每个物种MAE上的权重相等，以及能量MAE为0.50meV/原子，表明NequIP能够准确地模拟该复合物的原子间力反应系统。

为了检验NequIP模型捕捉动力学特性的能力，研究人员证明NequIP可以描述具有Li4P2O7成分的无定形磷酸锂的结构动力学。

表4：用于LiPS和Li4P2O7的NequiIPE/FMAE/RMSE。

为了证明NequIP可以从小型训练集以高精度模拟动力学传输特性，研究人员研究了LiPS(Li6.75P3S11)中的锂离子扩散率。测量了这些NequIP驱动的MD模拟中的Li扩散率，这些模拟从不同的初始速度开始，从Maxwell-Boltzmann分布中随机采样。

图3：锂动力学。

发现平均扩散率为1.25×cm^2/s，与AIMD计算的1.37×cm^2/s的扩散率非常一致，从而实现了低至9%的相对误差。

研究人员表示：未来工作的一个有希望的方向是研究明确包含远程交互的潜在好处，并测量消息传递机制在多大程度上（如果有的话）这些可能被捕获。我们期望所提出的方法将使计算化学、物理学、生物学和材料科学领域的研究人员能够以更高的准确性和效率对复杂反应和相变进行分子动力学模拟。

论文链接：