题名: | 基于监督机制的城市交通信号多智能强化学习控制方法 |
作者: | 张轮;张希雨;夏凡;赵文文 |
作者单位: | 同济大学道路与交通工程教育部重点实验室 |
关键词: | 交通工程;交通信号;多智能体强化学习;Q学习;网络稳定性;监督机制 |
摘要: | 在城市交通环境下;通过分析控制方法灵活性与稳定性的关系;提出一种考虑网络稳定性的多智能体强化学习控制方法。该方法将稳定状态引入信号控制决策模块;建立稳定规则库;在基本多智能体强化学习控制系统上;设置了一套独立运行的稳定监督装置;对违反稳定规则的控制策略进行校正;以约束控制方法灵活性的方式提升其稳定性;以监督控制的形式实现了多智能体强化学习控制。在时变交通流场景下;以典型路网进行VISSIM仿真试验。结果表明:基于稳定监督控制的多智能体强化学习控制方法提高了算法的运行效率;同时保证了控制效果;适用于复杂交通 |
期刊名称: | 交通与运输 |
出版年: | 2020 |
期: | 04 |
页码: | 86-91 |