[AI学术] 用户即代码：个性化代理的可执行内存

在个性化AI代理中，用户内存是一个持久的模型，通过多次对话构建并在每次对话中进行查询。当前，这种内存通常以非结构化文本、知识图谱或平面事实存储的方式存在，依赖检索来获取与当前请求最相似的条目。这种“事实袋”内存能够很好地回忆个别事实，但由于存储事实和执行操作是分开的步骤，它在解决矛盾、聚合多条记录或执行规则时表现不佳。我们提出用户内存应为可执行的。我们引入了用户即代码（UaC）这一范式，在该范式中，代理对用户的模型是一个活的代码项目：类型化的Python对象保存用户状态，普通的Python函数编码治理规则，因此在同一媒介中表示和推理用户。其启用机制为双阶段管道：一个只附加的日志从不丢弃任何事实，定期检查点到类型化代码中。这改变了内存的功能。在标准长期对话基准测试中，UaC在回忆方面匹配了完整上下文的上限和最强的先前内存系统（在LOCOMO上达到78.8%）。其优势在于表示最为重要的地方。在针对用户历史的聚合问题上——例如“我去年进行了多少次国际旅行？”——基于检索的内存表现不佳（6-43%），而UaC则保持接近完美（99%），因为答案是对类型状态的一行计算，而不是对文本的搜索。由于其规则在状态变化时以确定性执行，UaC可以提出未请求的、安全关键的警报，例如新开处方药与几个月前记录的过敏反应冲突，这是查询驱动的内存无法提供的功能。

博主点评： 用户即代码（UaC）提出了一个创新的思路，通过将用户的状态与行为规则结合在一起，极大地提升了个性化AI代理的智能水平。这种方法不仅提高了对用户历史的聚合处理能力，也为安全性提供了新的保障，值得关注与进一步研究。