当前位置: 首页> 学位论文 >详情
原文传递 基于WLAN的城市轨道交通越区切换算法优化研究
论文题名: 基于WLAN的城市轨道交通越区切换算法优化研究
关键词: 城市轨道交通;CBTC系统;越区切换
摘要: 随着国家的快速发展,城市轨道交通作为居民的重要出行方式发生日新月异的变化。列车越区切换是基于通信的列车运行控制(CommunicationBasedTrainControl,CBTC)系统的核心技术,保证列车与地面持续信息传输。无线局域网(WirelessLocalAreaNetworks,WLAN)的更新使其具备160MHz的频宽、4条空间流数和优化的调制方式使其依然在城市轨道交通所使用。但在传统的越区切换方式下会出现信息传输的中断,因此需要对越区切换方式进行优化,从而保证列车较为安全、稳定的运行。
  现如今的越区切换方式出现判决不准确、发生乒乓效应可能性较高、切换时间较长等诸多问题,传统越区切换难以满足城市轨道交通发展需求。因此,国内外大多数学者针对越区切换中触发参数或切换决策进行优化,但在切换延时、吞吐量等方面优化不够明显。针对以上问题分析城市轨道交通越区切换存在的缺陷,提出了基于深度强化学习(DeepQ-Network,DQN)越区切换算法。针对DQN算法越区切换进行模型架构,对模型中状态空间特征、动作数据、奖励函数等进行分析及参数规划。采用OPNET对列车运行与无线访问接入点(WirelessAccessPoint,AP)进行仿真,将DQN算法与仿真模型结合,添加信道干扰使仿真更贴合实际情况。DQN算法将列车状态空间特征进行提取,通过服务AP与目标AP的信号强度执行切换,最终在深度神经网络训练下得到不同速度的最佳切换位置。将最优切换位置代入MATLAB进行分析,结果表明使用该算法吞吐量性能提升大约为36%,数据包传输延时约降低55%,乒乓切换效应约降低53%,但算法的复杂度使得计算时间成本提高同时算法自身的稳定性不足,仍需要进一步优化处理。
  针对DQN算法的缺陷,提出了基于优先经验回放机制的深度确定性策略梯度(PrioritizedExperienceReplay-DeepDeterministicPolicyGradient,PER-DDPG)算法。将DQN算法扩展到多维连续环境,通过Q网络与经验缓存区结合进行状态值函数的更新。由于内部存在四个网络结构,使训练过程更平稳。传统经验回放机制为均匀采样使得部分重要经验被忽略,本文采用优先经验回放机制使重要信息被多次采集,提高训练效率从而使得算法计算时间成本缩短45.8%,改进后的算法可以更快训练得到列车最优切换位置,提高了越区切换的稳定性和计算时间成本,使得基于WLAN的城市轨道交通越区切换优化更加安全可靠。
作者: 王冶力
专业: 交通信息工程及控制
导师: 王成龙
授予学位: 硕士
授予学位单位: 兰州交通大学
学位年度: 2022
检索历史
应用推荐