NeFut Logo NeFut
EN 管理员登录

[AI学术] 用户即代码:个性化代理的可执行内存

发布于:2026-06-17 22:00 最后更新:2026-06-20 13:45
#algorithm #AI #Machine Learning

在个性化AI代理中,用户内存是一个持久的模型,通过多次对话构建并在每次对话中进行查询。当前,这种内存通常以非结构化文本、知识图谱或平面事实存储的方式存在,依赖检索来获取与当前请求最相似的条目。这种“事实袋”内存能够很好地回忆个别事实,但由于存储事实和执行操作是分开的步骤,它在解决矛盾、聚合多条记录或执行规则时表现不佳。我们提出用户内存应为可执行的。我们引入了用户即代码(UaC)这一范式,在该范式中,代理对用户的模型是一个活的代码项目:类型化的Python对象保存用户状态,普通的Python函数编码治理规则,因此在同一媒介中表示和推理用户。其启用机制为双阶段管道:一个只附加的日志从不丢弃任何事实,定期检查点到类型化代码中。这改变了内存的功能。在标准长期对话基准测试中,UaC在回忆方面匹配了完整上下文的上限和最强的先前内存系统(在LOCOMO上达到78.8%)。其优势在于表示最为重要的地方。在针对用户历史的聚合问题上——例如“我去年进行了多少次国际旅行?”——基于检索的内存表现不佳(6-43%),而UaC则保持接近完美(99%),因为答案是对类型状态的一行计算,而不是对文本的搜索。由于其规则在状态变化时以确定性执行,UaC可以提出未请求的、安全关键的警报,例如新开处方药与几个月前记录的过敏反应冲突,这是查询驱动的内存无法提供的功能。

博主点评: 用户即代码(UaC)提出了一个创新的思路,通过将用户的状态与行为规则结合在一起,极大地提升了个性化AI代理的智能水平。这种方法不仅提高了对用户历史的聚合处理能力,也为安全性提供了新的保障,值得关注与进一步研究。

原文链接: https://arxiv.org/abs/2606.16707

[h] 返回首页