NeFut Logo NeFut
EN 管理员登录

[AI学术] MINIM:通过可信本地清理实现隐私保护的最小视图

发布于:2026-06-15 22:00 最后更新:2026-06-16 12:14
#privacy #LLM #Security

摘要

现代基于大语言模型的自主代理越来越依赖丰富的用户界面(UI)状态观察,以便在复杂数字环境中实现可靠的行动基础。然而,许多部署方案在将完整的 UI 状态传输到远程推理服务器时,往往会包括与当前任务无关的许多元素,这可能泄露敏感但不必要的上下文信息,例如身份验证代码、私人通知和后台应用程序状态。

我们提出了 MINIM,一个可信的本地代理,在任何观察离开设备之前,执行隐私意识的最小化处理。MINIM 以上下文完整性(CI)为基础,为每个 UI 元素学习双重评分表示,预测固有的敏感性评分(s)和任务条件的必要性评分(n)。这些评分驱动一个三元披露策略:保留必要的元素,必要时抽象敏感属性,并移除与任务无关的内容。

我们优化了一个关注 CI 的目标函数,该函数对高风险内容的必要性错误施加更强的惩罚,从而实现激进的修剪,同时保留任务关键的信息。针对从 WebArena 派生的真实 UI 观察进行的实验表明,MINIM 显著减少了与任务无关的敏感泄露,同时保留了任务关键的语义上下文和代理行为所需的交互功能。

博主点评: MINIM通过引入双重评分机制,巧妙地解决了隐私与信息有效性之间的矛盾,为自主代理的安全性提供了新的思路。这种方法不仅提升了数据处理的效率,也为未来的隐私保护技术树立了标杆。其在真实应用场景中的实验结果更是证明了其实际应用价值。

原文链接: https://arxiv.org/abs/2606.13949

[h] 返回首页