当前位置: 首页> 学位论文 >详情
原文传递 基于深度Q-Learning的交通信号灯控制配时优化研究
论文题名: 基于深度Q-Learning的交通信号灯控制配时优化研究
关键词: 交通信号灯;配时优化;深度强化学习;密集采样;单一化奖励机制
摘要: 合理的交通信号配时对提升交通系统运行效率至关重要,体现在改善交通流量、节省燃油、减少车辆排队长度、提高驾驶员驾驶体验等方面。随着时代发展和交通容量的不断扩大,传统交通管理系统亟待改进,需要更高效的交通配时算法来提升环保节能、缓解道路拥塞、从而更好的促进城市经济发展。
  目前研究中已提出了多种交通信号配时方案:有传统的固定配时的方案,这种方案虽然简单易行,已不能满足当前的需要;有通过各种进化算法来优化交通配时,曾经取得了很好的成果,但目前处于瓶颈阶段难以突破;近年来,通过融合特征学习和智能决策的方式来提升交通系统性能研究,展示了极好的研究前景。本文基于这种思想,在深度强化学习(DQN)框架下对交通信号配时间题做了进一步探索,主要的研究内容和创新点如下:
  (1)本文针对交通信号控制系统的奖励机制进行了改进,将所有路口共享奖励的机制改进为每个交叉口共享唯一的奖励,这种单一化奖励机制增强了各个路口间的独立性,从而有效提升了交通控制系统的性能。
  (2)本文通过将密集采样策略与多路交叉口信号控制相结合,这种方式在一定程度上提高了控制系统的鲁棒性。
  (3)针对实验涉及的相应参数进行了优化,通过合理的参数设置,减少实验的偶然性,从而提高控制系统的稳定性。
  最终,为了保证研究的可靠性与客观性,文中所有的仿真实验都是基于当前国际主流交通模拟软件(Simulation of Urban MObility,SUMO)来完成。实验结果表明:相较于传统交通信号强化学习方法,结合密集采样和单一化奖励机制策略后的深度强化学习方法,对交通信号控制效果更佳。
作者: 赵纯
专业: 软件工程
导师: 董小明
授予学位: 硕士
授予学位单位: 安庆师范大学
学位年度: 2022
检索历史
应用推荐