论文题名: | 基于强化学习的交通网络信号控制模型研究 |
关键词: | 交通网络;信号控制;强化学习;多智能体系统;注意力机制 |
摘要: | 随着我国城市化进程迅速推进,机动车保有量不断增加,城市交通压力剧增引发的拥堵问题日益严重。交通信号控制可以有效解决不同方向车流在交叉口范围内行驶冲突,合理分配各流向车辆通行权,而交通网络内交叉口信号协同控制可以从交通网络整体层面提升交通运行效率,缓解城市交通拥堵问题。 本文从数据驱动控制策略角度切入,利用强化学习可以在与环境不断交互过程中自学习形成优化控制策略的特性,扩展交通网络多智能体控制规则和形式,研制基于强化学习的交通网络信号控制模型。根据交叉口信号控制模式差异,分别对步长式控制和周期式控制两种控制模式展开研究,着力解决强化学习模型应用实际控制时存在的数据获取、信息传输、模型计算等方面的难点问题。 本文将注意力机制融合于强化学习模型结构中,提升了交叉口对交通网络多尺度数据关键信息的探寻能力。采用中心训练分散执行模型框架,研究智能体利用历史状态数据决策方法,为决策过程提供充足的时间保障。提出利用交叉口出口道数据预测下游交叉口交通状态的方法,设置智能体感知不同复杂度环境信息实施控制实验,实验结果证明模型具有对部分信息缺失情况的处理能力,构建的模型结构可以高效提升模型感知、预测和决策能力。研究了周期式控制模式下连续-离散混合动作空间模型,实现了交叉口在不产生多次停车等待情况下尽可能减少车辆平均等待时间的周期式控制目标模型。 研发了面向交通控制的交通仿真控制平台,为研制的算法模型提供训练和测试标准化场景,并从行驶感受和交通网络性能多角度制定评价指标,与多种已被验证具有先进性的控制算法模型进行实验比较。实验证明本文构建模型在各方面指标均超越对比模型,能够快速疏散交通拥堵,控制拥堵区域范围,保持交通网络车辆平稳运行。 |
作者: | 刘晓瀚 |
专业: | 交通运输工程;交通运输规划与管理 |
导师: | 王昊 |
授予学位: | 硕士 |
授予学位单位: | 东南大学 |
学位年度: | 2022 |