[AI学术] MINIM：通过可信本地清理实现隐私保护的最小视图

摘要

现代基于大语言模型的自主代理越来越依赖丰富的用户界面（UI）状态观察，以便在复杂数字环境中实现可靠的行动基础。然而，许多部署方案在将完整的 UI 状态传输到远程推理服务器时，往往会包括与当前任务无关的许多元素，这可能泄露敏感但不必要的上下文信息，例如身份验证代码、私人通知和后台应用程序状态。

我们提出了 MINIM，一个可信的本地代理，在任何观察离开设备之前，执行隐私意识的最小化处理。MINIM 以上下文完整性（CI）为基础，为每个 UI 元素学习双重评分表示，预测固有的敏感性评分（s）和任务条件的必要性评分（n）。这些评分驱动一个三元披露策略：保留必要的元素，必要时抽象敏感属性，并移除与任务无关的内容。

我们优化了一个关注 CI 的目标函数，该函数对高风险内容的必要性错误施加更强的惩罚，从而实现激进的修剪，同时保留任务关键的信息。针对从 WebArena 派生的真实 UI 观察进行的实验表明，MINIM 显著减少了与任务无关的敏感泄露，同时保留了任务关键的语义上下文和代理行为所需的交互功能。

博主点评： MINIM通过引入双重评分机制，巧妙地解决了隐私与信息有效性之间的矛盾，为自主代理的安全性提供了新的思路。这种方法不仅提升了数据处理的效率，也为未来的隐私保护技术树立了标杆。其在真实应用场景中的实验结果更是证明了其实际应用价值。