摘要
现代基于大语言模型的自主代理越来越依赖丰富的用户界面(UI)状态观察,以便在复杂数字环境中实现可靠的行动基础。然而,许多部署方案在将完整的 UI 状态传输到远程推理服务器时,往往会包括与当前任务无关的许多元素,这可能泄露敏感但不必要的上下文信息,例如身份验证代码、私人通知和后台应用程序状态。
我们提出了 MINIM,一个可信的本地代理,在任何观察离开设备之前,执行隐私意识的最小化处理。MINIM 以上下文完整性(CI)为基础,为每个 UI 元素学习双重评分表示,预测固有的敏感性评分(s)和任务条件的必要性评分(n)。这些评分驱动一个三元披露策略:保留必要的元素,必要时抽象敏感属性,并移除与任务无关的内容。
我们优化了一个关注 CI 的目标函数,该函数对高风险内容的必要性错误施加更强的惩罚,从而实现激进的修剪,同时保留任务关键的信息。针对从 WebArena 派生的真实 UI 观察进行的实验表明,MINIM 显著减少了与任务无关的敏感泄露,同时保留了任务关键的语义上下文和代理行为所需的交互功能。
博主点评: MINIM通过引入双重评分机制,巧妙地解决了隐私与信息有效性之间的矛盾,为自主代理的安全性提供了新的思路。这种方法不仅提升了数据处理的效率,也为未来的隐私保护技术树立了标杆。其在真实应用场景中的实验结果更是证明了其实际应用价值。