论文题名: | 基于FPGA异构平台的动态交通分配算法研究与实现 |
关键词: | 动态交通分配;多智能体;强化学习;FPGA异构;时空图注意力网络 |
摘要: | 动态交通分配技术(DynamicTrafficAssignment,DTA)是一种利用实时或预测的交通信息和需求,对交通流量进行实时优化和控制的技术,能够缓解交通拥堵并提高道路通行效率。随着大数据、边缘计算、物联网等技术的发展,DTA的分布式模型得到了广泛研究,由于其低复杂度、高并发性、易扩展性等特点,相比于集中式模型更能适应日益增长的大规模城市交通。其中多智能体强化学习算法(Multi-AgentReinforcementLearn-ing,MARL)和分布式DTA理论的结合能进一步提高系统的动态适应性,有效协调用户和系统最优,实现交通资源的合理配置。 但是复杂的路网环境和时变的交通数据对分布式节点设备的存储和计算能力提出了挑战,如何设计一个合理的算法部署方案并搭建高效的硬件平台,是一个需要软硬件协同解决的问题。针对以上问题,本文通过嵌入交通预测模块和图分解状态空间的方法改进MARL算法,并采用分布式架构将系统部署在车载FPGA异构平台上,从而实现大规模路网环境下交通流的实时分配。具体的工作如下: (1)为获取大规模城市路网的未来需求和交通状况,研究了一种基于时空图注意力网络的交通流预测方法。根据交通流生成特性将路段车流划分为自生成流量和多阶邻居扩散流量,在提取完数据时序特征后分别利用自生成流量解码器和可扩散的图注意力网络对二者进行建模,并融合时空特征得到预测结果。在多个数据集上的大量对比实验表明,该方法能在取得最优预测性能的同时,大幅降低模型参数冗余和计算资源消耗,实现对大规模城市交通数据的精准预测,为后续基于MARL的分布式DTA模型提供了宏观趋势参考。 (2)为应对日益增长的大规模城市交通数据,并兼顾DTA模型中用户均衡和系统最优准则,同时避免个人导航导致的路径趋同性,研究了一种嵌入交通预测模块的多智能体深度确定性策略梯度方法(Multi-AgentDeepDeterministicPolicyGradientwithTrafficPrediction,TP-MADDPG)。通过交通预测模块提高强化学习模型对未来环境状态空间的估计能力,使交通分配具有长期统筹能力;针对大量智能体产生的联合状态和动作空间维数过高问题,利用多阶邻居采样对路网图进行分解,去除与当前智能体行程无关的状态空间信息,重构智能体的状态空间;建立双重奖惩模块,分别从系统和用户角度对智能体行动策略进行激励。通过在真实数据集上的仿真实验验证了方法的有效性。 (3)在模型的分布式部署方面,针对大规模智能体情况下MADDPG训练时间长且资源受限的问题,基于车载FPGA异构平台实现模型的训练和推理过程。利用流水线操作和脑浮点数表示等技术设计硬件架构,并通过高层次综合工具(High-levelSynthesis,HLS)定制神经网络加速IP核;使用ARM端协调各个组件实现加速器调用、模型训练、云端通信等功能。上板实验表明,该平台能在较低功率和较少硬件资源的条件下实现推理和训练效率的大幅提升。 |
作者: | 袁凯 |
专业: | 软件工程 |
导师: | 李光明 |
授予学位: | 硕士 |
授予学位单位: | 陕西科技大学 |
学位年度: | 2023 |