NeFut Logo NeFut
EN 管理员登录

[AI学术] HarnessX:可组合、适应性强且可进化的智能体基础架构

发布于:2026-06-15 22:00 最后更新:2026-06-16 12:14
#algorithm #AI #Open Source

在人工智能领域,智能体的性能在很大程度上依赖于其运行时基础架构,包括提示、工具、记忆和控制流,这些因素决定了模型如何观察、推理和行动。

然而,现有的基础架构仍然主要是手工制作且静态的:每个新模型或任务仍然需要定制的支架,并且在执行过程中产生的丰富痕迹很少被提炼回系统性改进中。

我们介绍了 HarnessX,这是一个用于可组合、适应性强且可进化的智能体基础架构的工厂。HarnessX 通过替换代数组装类型化的基础架构原语,通过 AEGIS(一个基于执行痕迹的多智能体进化引擎)对其进行适应。AEGIS 在符号适应和强化学习之间建立了操作镜像,并通过将轨迹转化为基础架构更新和模型训练信号,闭合了基础架构与模型的循环。

在五个基准测试(ALFWorld、GAIA、WebShop、tau^3-Bench 和 SWE-bench Verified)中,HarnessX 平均获得了 +14.5% 的提升(最高可达 +44.0%),其中基线最低的地方增益最大。这些结果表明,智能体的进步不必仅依赖于模型扩展:从执行反馈中组合和进化运行时接口是一个可行且互补的杠杆。完整的代码库将在未来发布时开源。

博主点评: HarnessX 项目的提出为智能体的开发带来了新的思路,尤其是在动态适应与进化方面的结合上,展示了通过执行反馈来优化智能体性能的巨大潜力。这一理念将极大地推动智能体领域的研究与应用发展,期待其开源后的具体实现。

原文链接: https://arxiv.org/abs/2606.14249

[h] 返回首页