[AI学术] 物理信息驱动的注意力机制提升深度学习在晶粒生长预测中的泛化能力

在晶粒生长预测中，机器学习模型通常基于理想化的合成数据进行训练，但实际应用需要在训练分布之外的条件下进行泛化。本研究评估了我们之前研究中训练模型的超出分布（OOD）泛化能力，涵盖了三种测试案例，包括实验微观结构、双峰晶粒尺寸分布特征的微观结构以及异常晶粒生长。

为了探讨物理信息驱动的架构设计是否能够在这些不同条件下提高鲁棒性，本文提出了一种专门针对晶粒生长的边界掩膜注意力机制，限制注意力集中于晶界像素。基线模型和提出的物理信息驱动注意力模型在OOD数据上进行了评估，无需重新训练或微调。两个模型在所有三种测试案例中均成功泛化，但边界掩膜注意力机制提供了显著的改进，尤其是在双峰晶粒尺寸分布特征的微观结构中，结构相似性指数（SSIM）从0.6221提高至0.7609，平均晶粒尺寸（$ar{R}$）误差从8.75%降低至3.57%。

注意力热图分析揭示，边界掩膜注意力模型学习集中于大晶界的注意力，与基于曲率驱动的晶粒生长物理一致，且这一特性是在训练过程中自发形成的，而非明确编码到架构中。这些结果表明，在合成数据上训练的模型能够在多样化的OOD条件下泛化，而物理信息驱动的注意力机制在边界形态与训练领域匹配时可以提高准确性。

博主点评： 该研究展示了物理信息与深度学习结合的潜力，尤其是在复杂材料科学领域，强调了模型在实际应用中的泛化能力。通过引入边界掩膜注意力机制，研究不仅提升了预测精度，也为未来的相关研究提供了新的方向，值得关注。