[AI学术] 离散对数时钟：变压器如何学习模乘运算

在小型变压器模型理解模乘运算时，之前的研究指出所学习的嵌入具有“密集”的傅里叶谱，需用到所有频率。这与模加运算形成对比，模加只需一组稀疏的关键频率。我们证明，这种密度是因在错误的基底上分析所致。乘法的自然傅里叶变换并非标准的加法离散傅里叶变换，而是乘法特征变换，能够将 $(\mathbb{Z}/p\mathbb{Z})^*$ 上的函数分解为其不可约表示。应用此变换于一个经过训练的变压器，计算 $a \cdot b \bmod 113$，我们发现嵌入谱变得高度稀疏（基尼系数 0.58 对比加法基底的 0.07），仅有 4 个关键频率携带显著能量。此外，96.9% 的多层感知机（MLP）神经元被精确调谐到一个单一的乘法频率，神经元激活热图在按离散对数重新排序时显示出二维周期结构。这些结果表明，变压器在离散对数空间中将乘法简化为加法，实现了一种类似于 Nanda 等人的加法时钟算法的“离散对数时钟”算法。该方法具有普遍性：将分析基底与任务的代数结构匹配能够揭示可解释的结构，而标准工具则将其视为噪声。

博主点评： 本文通过引入乘法特征变换，揭示了变压器在模乘运算中潜在的稀疏性，提供了新的视角来理解神经网络的学习机制。这一发现不仅丰富了变压器的应用场景，还为后续研究提供了重要的理论框架，值得深入探讨与研究。