在IoT设备监控的城市交通信号控制中,必须有效应对传感器遮挡、天气衰减和非平稳需求等挑战。传统控制器在这些条件下表现不佳,而学习策略的审核也相对困难。为了解决这些问题,我们提出了一种主动推理控制器,针对四臂信号交叉口动态选择信号相位,通过最小化对每个方向拥堵水平的高斯信念的期望自由能(EFE),形成一个完全可追溯的决策流程。
我们在SUMO交通模拟器中对该控制器进行了基准测试,与基于规则的启发式方法和深度Q网络(DQN)在四种逐步增加噪声和非平稳性的场景下进行比较,这些场景涵盖了传感器遮挡、不利天气和随机事故。在每种场景下进行100次独立随机评估后,结果显示,在最嘈杂的场景中,主动推理实现了最低的空闲时间和CO2排放(56,977秒和29.12千克,相比DQN的71,741秒和30.56千克)。这些收益的代价是公交优先服务率和相位切换频率的适度下降。
博主点评: 该研究展示了主动推理在复杂动态环境中的应用潜力,通过有效应对不确定性,提升了交通信号控制的效率,为智能交通系统的发展提供了新的思路和方法。其在真实世界应用中的可行性值得进一步探索。