NeFut Logo NeFut
EN 管理员登录

[AI学术] 革命性工具增强LLM的多智能体合成数据生成平台

发布于:2026-06-17 22:00
#AI #Machine Learning #Open Source

摘要

训练工具增强的大型语言模型(LLM)代理需要大量的多轮、工具基础的对话数据,这类数据的标注成本高昂,并且在生产环境中受到隐私限制,公共数据集中几乎缺乏。我们提出了StateGen,一个合成数据生成平台,通过协调四个角色的LLM循环,生成丰富的评分和推理轨迹的训练对话:一个基于角色的用户模拟器、一个待测试的代理、一个状态基础的工具模拟器和一个多轴LLM评判者。

关键架构贡献

该平台的关键架构贡献是一个权威的状态管理器,它在多轮对话中维护一个结构化的世界状态对象,强制执行“后端即真”的不变性,从而通过构建消除了主导的工具调用幻觉。StateGen自然扩展到分层的多智能体设置,声明子代理为工具,共享一个单一的状态对象。

实验结果

我们报告了在三个生产语料库中评估的64,698个对话结果:工具调用幻觉评分达到9.66/10,系统通过一个23维特征向量支持基于角色的变体,并且干净分开的训练集和黄金评估集分割确认数据并非记忆诱饵(逐项差距分析)。与八个外部系统的比较显示,没有任何一个公共平台结合了多轮生成、状态基础的工具模拟、分层多智能体支持和内置评判评分。

博主点评: StateGen以其创新的四角色LLM循环架构,成功解决了工具调用幻觉的问题,极大地提升了工具增强LLM的训练质量。其在多智能体环境中的应用潜力值得关注,未来可能引领合成数据生成的新潮流。

原文链接: https://arxiv.org/abs/2606.16307

[h] 返回首页