论文题名: | 基于深度Q-Learning的交通信号灯控制配时优化研究 |
关键词: | 交通信号灯;配时优化;深度强化学习;密集采样;单一化奖励机制 |
摘要: | 合理的交通信号配时对提升交通系统运行效率至关重要,体现在改善交通流量、节省燃油、减少车辆排队长度、提高驾驶员驾驶体验等方面。随着时代发展和交通容量的不断扩大,传统交通管理系统亟待改进,需要更高效的交通配时算法来提升环保节能、缓解道路拥塞、从而更好的促进城市经济发展。 目前研究中已提出了多种交通信号配时方案:有传统的固定配时的方案,这种方案虽然简单易行,已不能满足当前的需要;有通过各种进化算法来优化交通配时,曾经取得了很好的成果,但目前处于瓶颈阶段难以突破;近年来,通过融合特征学习和智能决策的方式来提升交通系统性能研究,展示了极好的研究前景。本文基于这种思想,在深度强化学习(DQN)框架下对交通信号配时间题做了进一步探索,主要的研究内容和创新点如下: (1)本文针对交通信号控制系统的奖励机制进行了改进,将所有路口共享奖励的机制改进为每个交叉口共享唯一的奖励,这种单一化奖励机制增强了各个路口间的独立性,从而有效提升了交通控制系统的性能。 (2)本文通过将密集采样策略与多路交叉口信号控制相结合,这种方式在一定程度上提高了控制系统的鲁棒性。 (3)针对实验涉及的相应参数进行了优化,通过合理的参数设置,减少实验的偶然性,从而提高控制系统的稳定性。 最终,为了保证研究的可靠性与客观性,文中所有的仿真实验都是基于当前国际主流交通模拟软件(Simulation of Urban MObility,SUMO)来完成。实验结果表明:相较于传统交通信号强化学习方法,结合密集采样和单一化奖励机制策略后的深度强化学习方法,对交通信号控制效果更佳。 |
作者: | 赵纯 |
专业: | 软件工程 |
导师: | 董小明 |
授予学位: | 硕士 |
授予学位单位: | 安庆师范大学 |
学位年度: | 2022 |