[AI学术] EvolveNav：自我进化的记忆与主动反思实现零次目标导航

摘要

零次目标导航（ZS-OGN）要求具身智能体在没有任何先前训练的情况下探索并定位目标对象。为此，近期的方法利用了基础模型，但通常依赖于静态先验且缺乏适应性，导致重复错误和高昂的试错成本。本文提出了一种自我进化的 ZS-OGN 框架，能够实现持续的测试时改进。

具体而言，我们通过从过去的轨迹中提取可操作知识，构建了一个智能规则记忆。然后，我们提出了一种基于上置信界的检索策略，通过平衡语义相关性和历史成功率来选择有效规则。此外，我们引入了一个记忆引导的反思模块，在行动之前预测潜在结果，从而减少无效探索。大量实验表明，我们的方法在成功率上比现有的零次基线提高了 10.1\%，并减少了不必要的步骤。

博主点评： EvolveNav 的创新在于其自我进化的记忆机制和主动反思模块，显著提升了零次目标导航的效率。这一方法不仅为智能体的自主学习提供了新思路，同时也为后续研究奠定了基础，值得关注和深入探讨。