详情

当前位置：首页> 学位论文 >详情

原文传递基于深度Q-Learning的交通信号灯控制配时优化研究

论文题名：	基于深度Q-Learning的交通信号灯控制配时优化研究
关键词：	交通信号灯;配时优化;深度强化学习;密集采样;单一化奖励机制
摘要：	合理的交通信号配时对提升交通系统运行效率至关重要，体现在改善交通流量、节省燃油、减少车辆排队长度、提高驾驶员驾驶体验等方面。随着时代发展和交通容量的不断扩大，传统交通管理系统亟待改进，需要更高效的交通配时算法来提升环保节能、缓解道路拥塞、从而更好的促进城市经济发展。　　目前研究中已提出了多种交通信号配时方案：有传统的固定配时的方案，这种方案虽然简单易行，已不能满足当前的需要；有通过各种进化算法来优化交通配时，曾经取得了很好的成果，但目前处于瓶颈阶段难以突破；近年来，通过融合特征学习和智能决策的方式来提升交通系统性能研究，展示了极好的研究前景。本文基于这种思想，在深度强化学习（DQN）框架下对交通信号配时间题做了进一步探索，主要的研究内容和创新点如下：　　(1)本文针对交通信号控制系统的奖励机制进行了改进，将所有路口共享奖励的机制改进为每个交叉口共享唯一的奖励，这种单一化奖励机制增强了各个路口间的独立性，从而有效提升了交通控制系统的性能。　　(2)本文通过将密集采样策略与多路交叉口信号控制相结合,这种方式在一定程度上提高了控制系统的鲁棒性。　　(3)针对实验涉及的相应参数进行了优化，通过合理的参数设置，减少实验的偶然性，从而提高控制系统的稳定性。　　最终，为了保证研究的可靠性与客观性，文中所有的仿真实验都是基于当前国际主流交通模拟软件(Simulation of Urban MObility,SUMO)来完成。实验结果表明：相较于传统交通信号强化学习方法，结合密集采样和单一化奖励机制策略后的深度强化学习方法，对交通信号控制效果更佳。
作者：	赵纯
专业：	软件工程
导师：	董小明
授予学位：	硕士
授予学位单位：	安庆师范大学
学位年度：	2022

相关文献

检索历史

应用推荐