论文题名: | 利用应答器信息的在线学习停车算法 |
关键词: | 列车运行;自动停车;停车控制;计算机技术 |
摘要: | 列车自动停车控制是列车自动驾驶(ATO)的重要组成功能之一。近几年,由于地铁车站加装了屏蔽门,工程应用对停车控制的准确性提出了新的要求,使得停车控制问题成为学术研究和工程应用的热门问题。然而,现有的解决办法时有发生屏蔽门与车门无法正常对位而影响乘客快速、安全换乘的情况,其需要周期频繁地变化控制器输出会过度耗损列车制动系统的使用寿命,从而增加列车运营的成本。本文从以下几个方面对列车自动停车控制问题展开研究: ⑴根据外界环境因素和列车制动特性,提出了影响列车停车准确性的几种因素,包括列车进站初始速度、制动系统时滞、制动系统时间常数、列车制动性能和列车基本阻力。根据停车过程的阶段性和反复性等特点,将强化学习方法应用于停车控制,通过制定在线学习策略(启发式学习策略、梯度下降学习策略和牛顿学习策略),使得控制器能够通过历史数据学习以提高控制性能。借鉴Monte Carlo和TD两种强化学习算法,通过不断试错的方式,搜索和探索最优控制策略,从而实现精确停车控制,以满足±30cm的停车需求。文中提出的学习算法借助站内布置的停车应答器的精确定位信息,可以有效避免列车自助定位设备累积误差对停车控制的影响,并且也有效的降低了控制器的变化频率,从而提高了停车准确性和制动系统的使用寿命。 ⑵通过现有地铁线路的运行数据,搭建了列车自动停车控制仿真平台。该平台能够模拟停车过程中的几种影响因素,通过编程实现GUI控制界面,可以方便的选择不同的控制算法、设定实验环境参数和模拟条件。通过用户设置,平台能够自动进行多次仿真测试,并显示控制性能指标,根据需要绘制仿真结果。借助Virtual Reality工具箱,可以实时显示列车运行3D动画,给研究工作带来了极大便利。 ⑶借助搭建的仿真平台对三种算法(PID、Monte Carlo和TD)进行大量的仿真实验测试,尽可能接近实际运营过程中的干扰情况。文中设定了仿真标准环境和确立了评估标准,以便评估算法的适应性和可用性。仿真实验结果表明,相对于传统的PID方法,对于系统时滞和进站初始速度变化情况,利用应答器信息的在线学习停车算法取得了较好的效果,准确停车率为100%,相比之下,传统的PID方法分别只有70%和97%。在两种学习算法中,TD学习算法相对于MonteCarlo学习算法有更快的学习速度和更好的停车仿真效果。 |
作者: | 陈荣 |
专业: | 智能交通工程 |
导师: | 陈德旺 |
授予学位: | 硕士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2013 |
正文语种: | 中文 |