[AI学术] HarnessX：可组合、适应性强且可进化的智能体基础架构

在人工智能领域，智能体的性能在很大程度上依赖于其运行时基础架构，包括提示、工具、记忆和控制流，这些因素决定了模型如何观察、推理和行动。

然而，现有的基础架构仍然主要是手工制作且静态的：每个新模型或任务仍然需要定制的支架，并且在执行过程中产生的丰富痕迹很少被提炼回系统性改进中。

我们介绍了 HarnessX，这是一个用于可组合、适应性强且可进化的智能体基础架构的工厂。HarnessX 通过替换代数组装类型化的基础架构原语，通过 AEGIS（一个基于执行痕迹的多智能体进化引擎）对其进行适应。AEGIS 在符号适应和强化学习之间建立了操作镜像，并通过将轨迹转化为基础架构更新和模型训练信号，闭合了基础架构与模型的循环。

在五个基准测试（ALFWorld、GAIA、WebShop、tau^3-Bench 和 SWE-bench Verified）中，HarnessX 平均获得了 +14.5% 的提升（最高可达 +44.0%），其中基线最低的地方增益最大。这些结果表明，智能体的进步不必仅依赖于模型扩展：从执行反馈中组合和进化运行时接口是一个可行且互补的杠杆。完整的代码库将在未来发布时开源。

博主点评： HarnessX 项目的提出为智能体的开发带来了新的思路，尤其是在动态适应与进化方面的结合上，展示了通过执行反馈来优化智能体性能的巨大潜力。这一理念将极大地推动智能体领域的研究与应用发展，期待其开源后的具体实现。