[AI学术] TrustErase：可审计的瞬时机器遗忘新纪元

摘要

随着对隐私合规 AI 的需求日益增加，机器遗忘的需求也随之上升；然而，现有的基于重训练或蒸馏的方法仍然难以验证且计算成本高昂。我们提出了 TrustErase，一个可验证的、无数据的遗忘框架，利用嵌入护照的表示实现瞬时、模块化和可审计的遗忘。

TrustErase 将护照视为参数高效适应层中的加密密钥，通过简单的停用实现特定类别或数据集的移除，无需重训练、微调或访问原始数据。基于奇异值分解的方法将护照隐藏在模型权重中，确保遗忘操作的透明性和可证明的合规性。

在 MNIST、CIFAR10 和 CIFAR100 上的评估表明，TrustErase 的表现与 DELETE、L2UL 和 Boundary Shrink 等最先进的基准相匹配或超越，同时在严格的无数据环境下运行。最终，TrustErase 为值得信赖、可问责和瞬时可遗忘的 AI 系统建立了新的范式。

博主点评： TrustErase 的提出不仅解决了隐私合规的难题，还推动了机器学习领域对可审计性与高效性的追求。其创新的护照嵌入技术为未来 AI 系统的透明性与安全性提供了新的可能性。