[AI学术] APEX：自适应原则提取的三层自我进化框架，推动生产AI代理的革新

摘要

自我改进的AI代理已成为关键研究前沿：这些系统能够基于积累的操作经验修改自身的提示、工作流程和决策规则。现有的Self-Harness框架在Terminal-Bench-2.0上实现了14%到21%的改进，主要通过挖掘故障集群并修补代理的外部接口。然而，Self-Harness仅优化了一个维度——提示接口，而未改变行为原则和工作流程拓扑。

我们提出了APEX（自适应原则提取），这是一个三层共进化框架，同时演化以下三个层次：

层级1：通过故障模式修补优化接口。
层级2：通过成功轨迹蒸馏演化行为原则。
层级3：通过基于结构适应性的选择演化代理工作流程拓扑。

我们在Joe上实现了APEX，这是一个基于NVIDIA Nemotron构建的生产级超级AI代理，旨在作为NVIDIA代理挑战2026的边缘AI代理工厂，管理一个15节点的计算集群，并使用在18天内收集的114个真实任务轨迹。APEX在一次进化运行中达到了0.570的APEX健康评分（比基线0.300提高了90%），蒸馏出6个新颖的可重用原则，并选择了一个研究首创的工作流程拓扑，评分为0.900（提高了20%）。我们的结果表明，多维度共进化显著优于单轴接口优化，而成本仅为4次LLM调用（约270秒），在本地qwen2.5-coder:32b实例上执行。

博主点评： APEX框架通过多维度的自我进化显著提升了AI代理的性能，为未来的智能系统提供了新的设计思路。同时，该方法在效率和效果之间取得了良好的平衡，展示了自我改进在实际应用中的巨大潜力。