NeFut Logo NeFut
EN 管理员登录

[AI学术] EvolveNav:自我进化的记忆与主动反思实现零次目标导航

发布于:2026-06-18 22:00 最后更新:2026-06-20 13:47
#algorithm #AI #Machine Learning

摘要

零次目标导航(ZS-OGN)要求具身智能体在没有任何先前训练的情况下探索并定位目标对象。为此,近期的方法利用了基础模型,但通常依赖于静态先验且缺乏适应性,导致重复错误和高昂的试错成本。本文提出了一种自我进化的 ZS-OGN 框架,能够实现持续的测试时改进。

具体而言,我们通过从过去的轨迹中提取可操作知识,构建了一个智能规则记忆。然后,我们提出了一种基于上置信界的检索策略,通过平衡语义相关性和历史成功率来选择有效规则。此外,我们引入了一个记忆引导的反思模块,在行动之前预测潜在结果,从而减少无效探索。大量实验表明,我们的方法在成功率上比现有的零次基线提高了 10.1\%,并减少了不必要的步骤。

博主点评: EvolveNav 的创新在于其自我进化的记忆机制和主动反思模块,显著提升了零次目标导航的效率。这一方法不仅为智能体的自主学习提供了新思路,同时也为后续研究奠定了基础,值得关注和深入探讨。

原文链接: https://arxiv.org/abs/2606.18235

[h] 返回首页