NeFut Logo NeFut
EN 管理员登录

[AI学术] APEX:自适应原则提取的三层自我进化框架,推动生产AI代理的革新

发布于:2026-06-16 22:00 最后更新:2026-06-17 01:38
#AI #Machine Learning #optimization

摘要

自我改进的AI代理已成为关键研究前沿:这些系统能够基于积累的操作经验修改自身的提示、工作流程和决策规则。现有的Self-Harness框架在Terminal-Bench-2.0上实现了14%到21%的改进,主要通过挖掘故障集群并修补代理的外部接口。然而,Self-Harness仅优化了一个维度——提示接口,而未改变行为原则和工作流程拓扑。

我们提出了APEX(自适应原则提取),这是一个三层共进化框架,同时演化以下三个层次:

  1. 层级1:通过故障模式修补优化接口。
  2. 层级2:通过成功轨迹蒸馏演化行为原则。
  3. 层级3:通过基于结构适应性的选择演化代理工作流程拓扑。

我们在Joe上实现了APEX,这是一个基于NVIDIA Nemotron构建的生产级超级AI代理,旨在作为NVIDIA代理挑战2026的边缘AI代理工厂,管理一个15节点的计算集群,并使用在18天内收集的114个真实任务轨迹。APEX在一次进化运行中达到了0.570的APEX健康评分(比基线0.300提高了90%),蒸馏出6个新颖的可重用原则,并选择了一个研究首创的工作流程拓扑,评分为0.900(提高了20%)。我们的结果表明,多维度共进化显著优于单轴接口优化,而成本仅为4次LLM调用(约270秒),在本地qwen2.5-coder:32b实例上执行。

博主点评: APEX框架通过多维度的自我进化显著提升了AI代理的性能,为未来的智能系统提供了新的设计思路。同时,该方法在效率和效果之间取得了良好的平衡,展示了自我改进在实际应用中的巨大潜力。

原文链接: https://arxiv.org/abs/2606.15363

[h] 返回首页