摘要
随着对隐私合规 AI 的需求日益增加,机器遗忘的需求也随之上升;然而,现有的基于重训练或蒸馏的方法仍然难以验证且计算成本高昂。我们提出了 TrustErase,一个可验证的、无数据的遗忘框架,利用嵌入护照的表示实现瞬时、模块化和可审计的遗忘。
TrustErase 将护照视为参数高效适应层中的加密密钥,通过简单的停用实现特定类别或数据集的移除,无需重训练、微调或访问原始数据。基于奇异值分解的方法将护照隐藏在模型权重中,确保遗忘操作的透明性和可证明的合规性。
在 MNIST、CIFAR10 和 CIFAR100 上的评估表明,TrustErase 的表现与 DELETE、L2UL 和 Boundary Shrink 等最先进的基准相匹配或超越,同时在严格的无数据环境下运行。最终,TrustErase 为值得信赖、可问责和瞬时可遗忘的 AI 系统建立了新的范式。
博主点评: TrustErase 的提出不仅解决了隐私合规的难题,还推动了机器学习领域对可审计性与高效性的追求。其创新的护照嵌入技术为未来 AI 系统的透明性与安全性提供了新的可能性。