NeFut Logo NeFut
EN 管理员登录

[AI学术] 基于阶段感知的指导注入框架助力工业组装线故障恢复

发布于:2026-06-17 22:00 最后更新:2026-06-20 13:44
#algorithm #AI #optimization

在工业组装线的故障恢复中,需要在机器故障、工人缺席和紧急订单情况下迅速做出决策。现有方法要么依赖于僵化的手工恢复逻辑,要么学习自适应策略,但这些策略在决策时并未充分利用异质的外部恢复知识,从而导致异常恢复时间(ART)和按时交付(OTD)的损失。为了解决这一问题,我们提出了一种阶段感知的指导注入框架,该框架通过在评估期间的logit级别动作偏置来增强训练后的递归MAPPO(RMAPPO)调度策略。该框架为基于规则、基于重放和在线LLM的指导提供了统一的决策时间接口,同时仅在异常和恢复阶段激活干预。我们在自定义的AssemblyLineEnv上进行的实验表明,高质量的规则指导带来了最显著的收益,基于重放的指导在可用性不佳时平滑下降,而在线LLM指导依然提供了有用的中间改进。这些结果表明,决策时间的指导注入能够在不重新设计演员的情况下,利用异质的恢复提示。

博主点评: 该研究为工业生产中的动态决策提供了新的思路,通过阶段感知的方式有效整合了多种指导策略,显示了在复杂环境中实时调整决策的重要性。未来的研究可以进一步探索如何优化这些指导策略以适应更广泛的应用场景。

原文链接: https://arxiv.org/abs/2606.16330

[h] 返回首页