NeFut Logo NeFut
EN 管理员登录

[AI学术] TRACE:延迟证据视觉运动模仿的轨迹路由因果记忆

发布于:2026-06-16 22:00 最后更新:2026-06-17 01:38
#algorithm #AI #Machine Learning

在自主操作的机器人中,可能需要根据已不再可见的证据做出决策。我们研究了 extbf{延迟证据}任务,在这些任务中,早期线索在后续决策点之前消失,因此视觉上相似的观察可能需要不同的行动。在这种情况下,当前观察并不足以作为控制的充分状态。我们提出了 extbf{轨迹路由因果证据}(TRACE),这是一个用于视觉运动模仿策略的记忆框架。

TRACE存储与任务相关的视觉和机器人状态证据,例如对象身份、目标选择或路径依赖状态,这些信息存储在一个固定大小的潜在记忆中,能够在长时间的任务中保持界限。TRACE并不是通过原始时间或手动提供的任务标签来索引记忆,而是使用 extbf{路径签名}:这是执行的机器人状态轨迹的紧凑且敏感于顺序的特征。这些签名并不存储视觉线索本身,而是提供轨迹条件下的键,用于在线索可见时写入和检索存储的证据。当机器人后续遇到模糊的观察时,策略会基于TRACE记忆恢复缺失的上下文并选择正确的分支。

TRACE通过轻量级适配器与策略连接,而不改变策略主干、动作头或模仿目标。在实际的长时间操作任务中,TRACE在视觉上模糊的分支点上提高了分支选择和任务成功率,相较于短历史和递归记忆等替代基线。

项目页面:TRACE Project

博主点评: TRACE通过引入轨迹路由因果记忆,为解决动态环境中的决策问题提供了新的思路。其在处理视觉模糊情况下的能力,展示了记忆机制在机器人学习中的重要性,尤其是在复杂任务中,能够显著提升任务成功率,值得深入研究与应用。

原文链接: https://arxiv.org/abs/2606.14551

[h] 返回首页