当前位置: 首页> 学位论文 >详情
原文传递 基于深度强化学习的交通信号控制研究
论文题名: 基于深度强化学习的交通信号控制研究
关键词: 智能交通系统;深度强化学习;神经网络
摘要: 随着社会的进步与发展,人们对交通出行的体验和要求也变的越来越苛刻,而智能交通系统(IntelligentTransportationSystem,ITS)在缓解交通拥堵方面发挥着关键的作用。深度学习和强化学习等技术为实现一种更高效、更方便的交通信号控制方法提供了可能性。本文探索研究并应用了深度强化学习算法模型,把交叉口的车辆和交通信号控制器组成的闭环系统作为主要的研究对象,在规定的模拟环境中完成车辆的实时调整,提高车辆的通行时效性。本文所做的工作如下:
  (1)基于全连接神经网络的Q网络模型的交通信号控制分析。在此模型中,首先分析了影响全连接神经网络结果的因素;接着重点研究了结构参数中的神经元数量与隐藏层的层数对仿真结果的影响,通过相关仿真得出了神经元取何数量会对最后的仿真结果有促进作用;最后,对神经元个数与隐藏层层数共同作用产生的仿真结果和神经元个数单独作用下的仿真结果进行了对比分析,结果表明神经元单独作用下的仿真结果要优于共同作用产生的仿真结果。
  (2)基于卷积神经网络的Q网络模型的交通信号控制分析。在此模型中,首先分析了影响卷积神经网络结果的因素;接着重点研究了结构参数中的卷积核大小、卷积层的层数以及运行参数中的批尺寸、学习率对本仿真的影响,而且通过相关仿真验证了卷积核的大小会对最后的仿真结果有影响;然后通过仿真对比了卷积核大小与卷积层层数共同作用下和卷积核大小单独作用下的仿真结果,分析可得卷积核单独作用下的仿真结果要优于共同作用产生的仿真结果;最后通过仿真验证了运行参数的优化对仿真结果有一定的促进作用,也对比了运行参数单独作用和运行参数与卷积核共同作用下的仿真结果,分析发现共同作用下的仿真结果优于单独作用下的仿真结果。
  在限定的仿真指标下,对上述两种模型进行分析对比,得到了不同指标下的较优模型。
作者: 黄亚男
专业: 电子与通信工程
导师: 曾振平
授予学位: 硕士
授予学位单位: 南京理工大学
学位年度: 2021
检索历史
应用推荐