[算法理论] 颠覆认知：单调对抗性污染下的学习算法失效

在本文中，我们研究了标准机器学习算法在数据的可交换性与独立性方面的依赖程度，提出了一种单调对抗性污染模型。在该模型中，攻击者在查看一组“干净”的独立同分布（i.i.d.）数据集后，可以选择性地插入额外的“污染”点。这些增加的点被约束为单调污染，即它们根据真实目标函数进行标记。

令人惊讶的是，我们证明在这种情况下，所有已知的二分类最优学习算法在独立测试点上可能会达到次优的期望误差，而这些测试点来自与干净数据集相同的分布。相对而言，我们展示了基于均匀收敛的算法不会降低其保证。这些结果揭示了最优学习算法在面对看似有益的单调污染时的崩溃，暴露了它们对可交换性的过度依赖。

博主点评： 本文揭示了机器学习模型在面对对抗性数据污染时的脆弱性，强调了可交换性假设的风险。这一发现对未来算法的设计与数据处理策略提出了新的挑战，促使我们重新审视模型的鲁棒性与适应性。使用单调污染的策略为理解算法的局限性提供了深刻的视角。