论文题名: | 基于预测交通流的交通信号控制优化 |
关键词: | 深度强化学习;交通信号;动态策略;智能控制 |
摘要: | 近年来,随着我国经济的快速增长与国民生活水平的不断改善,小汽车逐渐地普及到了越来越多的家庭,这种汽车普及的现象也造成了国内私家车持有率大幅增长,并且随着国内城镇化水平不断提高,私家车持有率增速最快的地方基本都集中在城市中,因此也就导致了现有城市交通道路设施建设与升级的速度无法与目前私家车的大量普及而引起的城市路网车流量快速增长相匹配。城市的道路拥堵且通行效率不高,成为大城市道路交通的一个常态。交通拥堵成为我国城市化发展进程中需要亟待解决的问题之一。因此,深入分析研究国内外各大城市交通拥堵现状,采用更高效的交通策略来提高交通路网车辆通行效率解决交通拥堵,也成为国内外交通领域研究的热门话题。 交通信号灯作为在交叉路口控制车辆流通的工具,对整个道路交通的通行能力有着十分重要的作用。近年来,利用深度强化学习(DeepReinforcementLearning,DRL)方法进行道路交叉口交通信号灯信号控制的研究逐渐受到关注。与传统的固定时间间隔或手动设定的交通信号控制方法相比,利用DRL方法进行交通信号控制具有自适应性、实时性和效果优良等优点。 本文提出一种结合预测交通流状态的DRL交通信号控制算法,该算法将长短期记忆神经网络(LSTM)与双深度Q网络(DoubleDeepQ-Network)相结合,构建交通信号自适应控制模型。该模型利用LSTM预测未来交叉路口的交通状态(交通流状态),通过预测状态并结合Q-learning的方式改进DoubleDQN中Target目标网络的Q值计算方式。该模型还在原有的DoubleDQN网络中加入动态?动作选择策略,该策略改变传统DQN类算法使用线性函数来调控动作选择策略的方式,使用线性函数与Sigmoid函数构成的分段函数来调控算法中最优动作选择的随机性,该函数相比传统方法更加平滑。本文通过以上方法的改进可以较好地避免传统的DQN目标网络过高估计Q值的问题以及提高训练模型的可靠性。本文利用KDD城市大脑比赛所提供的仿真引擎和模拟实际交通环境的路网数据进行仿真实验,通过构建交叉口与其之间连通的道路所形成的路网为研究对象,在该路网区域内使得交叉路口所能提供的车辆最大承载数量增加,同时最大程度地减少路网车辆的平均延迟。通过与其他一些改进的DQN交通信号控制方法进行比较,实验结果表明,该算法能够在不同的路况和交通流量情况下有效地优化交通信号控制策略,提高道路交通效率和安全性。 |
作者: | 占俊卿 |
专业: | 软件工程 |
导师: | 邓庆山 |
授予学位: | 硕士 |
授予学位单位: | 江西财经大学 |
学位年度: | 2023 |