[AI学术] 革命性工具增强LLM的多智能体合成数据生成平台

摘要

训练工具增强的大型语言模型（LLM）代理需要大量的多轮、工具基础的对话数据，这类数据的标注成本高昂，并且在生产环境中受到隐私限制，公共数据集中几乎缺乏。我们提出了StateGen，一个合成数据生成平台，通过协调四个角色的LLM循环，生成丰富的评分和推理轨迹的训练对话：一个基于角色的用户模拟器、一个待测试的代理、一个状态基础的工具模拟器和一个多轴LLM评判者。

关键架构贡献

该平台的关键架构贡献是一个权威的状态管理器，它在多轮对话中维护一个结构化的世界状态对象，强制执行“后端即真”的不变性，从而通过构建消除了主导的工具调用幻觉。StateGen自然扩展到分层的多智能体设置，声明子代理为工具，共享一个单一的状态对象。

实验结果

我们报告了在三个生产语料库中评估的64,698个对话结果：工具调用幻觉评分达到9.66/10，系统通过一个23维特征向量支持基于角色的变体，并且干净分开的训练集和黄金评估集分割确认数据并非记忆诱饵（逐项差距分析）。与八个外部系统的比较显示，没有任何一个公共平台结合了多轮生成、状态基础的工具模拟、分层多智能体支持和内置评判评分。

博主点评： StateGen以其创新的四角色LLM循环架构，成功解决了工具调用幻觉的问题，极大地提升了工具增强LLM的训练质量。其在多智能体环境中的应用潜力值得关注，未来可能引领合成数据生成的新潮流。