摘要
生成动态模型使得在复杂的机器人系统中进行规划成为可能,但安全部署要求可靠地检测由策略引起的分布外(OOD)转变。现有方法通常将学习到的动态视为固定,并附加后期支持代理。然而,我们展示了当动态对关键动作选择局部不敏感时,这些代理可能会失效:不支持的控制动作可能产生与示范转变相似的潜在预测,从而抑制OOD信号,尽管真实的预测误差很大。
为了应对这一问题,我们引入了支持条件控制灵敏度正则化,它促进在高支持训练区域内对控制输入变化的灵敏局部响应。这种方法保留了控制引起的变化,同时限制了由于经验支持不足而导致的不稳定外推。
在基于视觉的障碍物规避、操控和真实机器人导航的实验中,我们展示了改进的OOD检测能力和更安全的闭环规划。
博主点评: 本文提出的支持条件控制灵敏度正则化方法,为机器人动态建模提供了一种新思路,显著提升了系统对控制输入变化的敏感性,确保了在复杂环境下的安全性,值得关注。