[AI学术] TRACE：延迟证据视觉运动模仿的轨迹路由因果记忆

在自主操作的机器人中，可能需要根据已不再可见的证据做出决策。我们研究了 extbf{延迟证据}任务，在这些任务中，早期线索在后续决策点之前消失，因此视觉上相似的观察可能需要不同的行动。在这种情况下，当前观察并不足以作为控制的充分状态。我们提出了 extbf{轨迹路由因果证据}（TRACE），这是一个用于视觉运动模仿策略的记忆框架。

TRACE存储与任务相关的视觉和机器人状态证据，例如对象身份、目标选择或路径依赖状态，这些信息存储在一个固定大小的潜在记忆中，能够在长时间的任务中保持界限。TRACE并不是通过原始时间或手动提供的任务标签来索引记忆，而是使用 extbf{路径签名}：这是执行的机器人状态轨迹的紧凑且敏感于顺序的特征。这些签名并不存储视觉线索本身，而是提供轨迹条件下的键，用于在线索可见时写入和检索存储的证据。当机器人后续遇到模糊的观察时，策略会基于TRACE记忆恢复缺失的上下文并选择正确的分支。

TRACE通过轻量级适配器与策略连接，而不改变策略主干、动作头或模仿目标。在实际的长时间操作任务中，TRACE在视觉上模糊的分支点上提高了分支选择和任务成功率，相较于短历史和递归记忆等替代基线。

项目页面：TRACE Project

博主点评： TRACE通过引入轨迹路由因果记忆，为解决动态环境中的决策问题提供了新的思路。其在处理视觉模糊情况下的能力，展示了记忆机制在机器人学习中的重要性，尤其是在复杂任务中，能够显著提升任务成功率，值得深入研究与应用。