麻省理工学院的研究人员开发了一种长期记忆框架,使机器人能够快速形成和回忆复杂、大规模环境的详细心理模型。这一进展将使工人能够通过语言指令,让机器人助手去取物品,类似于询问“去拿我们昨晚开始组装的组件”。
该方法结合了先进的地图表示和丰富的环境描述,机器人在长时间移动中收集这些信息。该记忆框架不仅运行速度足够快,可以用于实时任务,还能比现有方法更准确地回答复杂查询。Luca Carlone教授表示:“如果我们希望机器人与人类并肩工作并更好地互动,它们必须使用相同的语言,能够像人类一样推理时间和空间。”
时空记忆
新型记忆框架旨在让机器人能够记住真实的交互和传感器观察。Carlone指出:“像ChatGPT一样,但扎根于现实世界,能够回答有关环境的任何问题,比如‘我把钱包放在哪里了?’”
研究人员将计算机视觉和机器人映射的两个研究方向结合,创造了名为“随时随地描述任何事物”(DAAAM)的方法。该方法使机器人在探索环境时,能够将丰富的描述附加到所见物体上,从而在3D地图上以空间方式存储这些信息。通过聚合附近物体并选择关键帧,DAAAM能够在实时性能中显著提高运算速度。
高效检索
DAAAM还利用大型语言模型(LLM)快速检索特定信息,减少错误。当与其他方法进行比较时,DAAAM的准确性提高了21%到53%。研究者们希望未来扩展DAAAM,捕捉环境中发生的重要事件,并为系统响应引入置信度水平。
本研究部分由美国陆军研究实验室和海军研究办公室资助。Carlone目前正在亚马逊担任学者,该文章描述的工作是在麻省理工学院进行的,且与亚马逊无关。
博主点评: 这一研究成果不仅为机器人在工业环境中的应用奠定了基础,还为未来智能助手的普及提供了可能性。随着机器人记忆能力的提升,它们将更有效地与人类协作,完成复杂的任务。未来,结合更多环境信息的智能机器人或许能成为我们生活中不可或缺的助手。