论文题名: | 概率图神经网络在交通信号控制中的应用 |
关键词: | 交通信号控制;图神经网络;变分自编码器;元强化学习 |
摘要: | 近年来,我国的城市化进程不断加快,越来越多的城市面临严重的交通拥塞问题。随着人工智能技术的进步,研究者希望通过研究城市智能交通信号控制,来解决目前城市交通堵塞的问题并建设高效的城市交通系统。最近的研究通过使用强化学习解决多交叉口交通信号的协作控制问题。然而,现有研究方法的强化学习建模不但没有考虑多交叉口复杂交通状况下的不确定性(Uncertainty)和交叉口的时序特征,而且这些基于强化学习的方法缺乏理论支撑。此外,应用于交通信号控制的强化学习模型存在训练成本高、模型收敛慢等缺点。 为了克服上述交通信号协作控制方法的局限性,本文提出了一种新的模型:基于概率图神经网络的交通信号控制(TSC-GNN)。该模型基于不确定性建模,创新性的将变分推断技术与图注意力网络相结合,通过描述交叉口特征隐变量的后验概率分布,计算期望与方差进而表征交通状况不确定性。此外,TSC-GNN将注意力机制相运用到循环神经网络(RNN)的特征提取结构中,使得交通信号控制模型能够有针对性的动态学习多个临近交叉口的时序特征。最后,针对目前基于强化学习的交通信号建模缺乏理论依据的问题,本文通过结合交通工程理论与排队论设计了TSC-GNN模型强化学习的状态,并解释强化学习建模中状态设计的合理性,从而避免了强化学习的启发式建模。 针对目前深度强化学习训练周期长、环境过拟合、模型泛化能力差的问题,本文创新性的将元学习应用到多交叉口交通信号控制中,在TSC-GNN模型的基础上引入了元学习的思想,提出了Meta-DQN模型(元深度学习Q网络模型)。该算法通过基础元学习、广义元学习和先验知识的迁移三部分,实现了基于一组任务来学习初始化参数的先验知识,最终提高了TSC-GNN模型的泛化能力和模型效果,加快了模型的收敛速度。 最后,为了验证本文提出的模型方法的有效性,本文选用了CityFlow交通信号仿真平台并对核心类进行了二次开发。针对TSC-GNN模型,本文在真实交通数据集和合成交通数据集上充分评估了模型的有效性并通过消融实验等对模型进行了解释。针对Meta-DQN模型,本文在三个真实交通数据集和三个合成交通数据集上从收敛速度和模型训练时间等方面评估了模型的性能。最终的实验结果表明本文提出的模型在性能上与现有的基线模型相比,实现了8%左右的提升。 |
作者: | 徐哲扬 |
专业: | 软件工程 |
导师: | 钟婷 |
授予学位: | 硕士 |
授予学位单位: | 电子科技大学 |
学位年度: | 2022 |