详情

当前位置：首页> 学位论文 >详情

原文传递基于强化学习的城市快速路交织区入口匝道智能控制方法

论文题名：	基于强化学习的城市快速路交织区入口匝道智能控制方法
关键词：	城市快速路;交织区;交通特性;匝道控制
摘要：	快速路匝道系统相比高速公路匝道系统，入口匝道和出口匝道之间的距离更近，交织区更易发生主线拥挤并向上游和入口匝道蔓延。通常用匝道控制来解决主线拥挤和入口匝道排队问题，传统方法存在交通模型构建、模型参数标定、依赖先验知识以及控制迟滞性等缺陷。本文基于强化学习研究快速路交织区匝道智能控制方法，直接利用实测数据对快速路路网多个入口匝道进行协调控制，且控制效果受控制参数设置的影响较小，是一类无模型、自学习的匝道智能控制方法。　　明确交织区基本概念，基于实际采集数据进行交织区交通特性分析，为后文仿真实验路网构建提供基础。　　介绍强化学习基本概念，分析Q学习算法及其改进算法SARSA的优劣性。基于SARSA算法建立单个匝道控制模型，以匝道调节量为行为，匝道排队长度、交织区通过量和占有率为状态，路网通过量为奖赏函数，确定行为空间、状态空间、奖赏函数和行为选择机制，形成基于SARSA的匝道局部控制方法(SRM)。　　基于多Agent强化学习方法，将匝道局部智能控制扩展至协调控制方法，对多个入口匝道进行控制。基于协作图法，给出其Q值矩阵更新规则、联合奖赏函数和最优联合行为策略，形成基于SARSA的匝道协调控制方法(CSRM);考虑匝道长度限制和交织区临界占有率逼近，对奖赏函数进行修正，使得算法能够充分利用空闲排队空间，且增大交织区交通通过量。　　构建Vissim-Matlab仿真平台，以南京卡子门快速路部分路段为仿真背景，将本文的局部和协调控制方法与传统方法进行对比。　　局部控制方案对比:新方法SRM相比于传统方法ALINEA平均延误减少16.10％，总延误减少12.10％，平均车速提升6.77％，总行程时间减少了3.78％;此外，SRM的匝道排队长度小于ALINEA，且高峰期拥挤匝道交织区平均交通通过量相比ALINEA提高了210veh/h。　　协调控制方案对比:新方法CSRM相对于传统方法BOTTLENECK平均延误减少4.31％，总延误减少2.09％，平均车速提升了3.69％，总行程时间基本持平;此外，高峰期CSRM的空闲匝道排队长度大于BOTTLENECK，拥挤匝道的排队长度小于BOTTLENECK，且拥挤匝道交织区平均交通通过量相比BOTTLENECK提高了140veh/h。　　本文提出将强化学习理论应用于匝道控制中，探讨智能控制方法在快速路交通领域的作用，为后续的研究提供了新思路。
作者：	韩靖
专业：	交通运输工程；交通信息工程及控制
导师：	柴干
授予学位：	硕士
授予学位单位：	东南大学
学位年度：	2017
正文语种：	中文

相关文献

检索历史

应用推荐