详情

当前位置：首页> 学位论文 >详情

原文传递基于强化学习的自适应城市交通信号控制方法研究

论文题名：	基于强化学习的自适应城市交通信号控制方法研究
关键词：	城市交通信号;控制系统;强化学习;通行效率
摘要：	城市道路不断兴建和扩宽，基础设施建设投入也越来越大，然而城市交通拥堵问题却越来越严重，主要原因是现有的城市交通信号控制TSC(Traffic SignalControl)系统不能充分做到对交通流量的最优控制和管理。因此，如何通过交通信号的最优控制来设计和优化城市TSC系统，成为保障交通安全和畅通、增加道路通行效率及其缓解交通拥塞问题的关键所在。　　本文选择基于Q-learning算法的单Agent控制体系结构，基于分布式Q-learning算法的Multi-Agent系统以及Green Light District(GLD)开源仿真平台进行城市TSC系统优化研究，主要做了如下工作: 　　(1)设计了基于单路口和井字形区域路口的城市TSC系统Agent框架，模拟城市道路控制。对于城市单路口，通过一个智能Agent实时检测每个方向的交通流数据，交通流数据通过模糊逻辑化，输入设计的单路口Q-learning决策器，寻得最优控制策略。对于区域交通控制，提出了分布式Q-leaining算法和MAS结合的优化控制方式，给出了相邻路口Agent协调控制模型，实现相邻路口之间信息共享。　　(2)解决了Q-learning算法和分布式Q-learning算法对交通环境状态集S、动作策略集A、奖惩函数R等关键问题。状态空间的选择，设计用模糊逻辑来计算排队长度;动作策略集A:增加、保持和减少相位绿灯时间;奖惩函数R以路口车辆排队长度作为指标，以车辆排队长度最小为目的。　　(3)实现了分布式Q-learning算法在区域TSC系统优化上的运用，解决了区域信号协调控制问题。分布式Q-learning算法和MAS的结合，实现对城市TSC系统最优控制。城市区域交通网络是分布式的多Agent网络，建立了基于分布式Q-learning算法的Multi-Agent模型框架，同时给出了分布式Q-learning算法设计的详细步骤。最后分析了基于Q-learning算法的单路口城市TSC优化和基于分布式Q-learning算法的区域TSC优化的算法性能。在GLD中，对随机配时，固定配时，Longest-queue，Traffic-controller1(TC1)，ACGJ-1、Q-learning算法和分布式Q-learning算法优化性能进行了模拟验证分析，实验结果表明了Q-learning算法和分布式Q-learning算法在城市TSC系统优化上优于其他算法。
作者：	王新
专业：	计算机科学与技术
导师：	朱信忠
授予学位：	硕士
授予学位单位：	浙江师范大学
学位年度：	2015
正文语种：	中文

相关文献

检索历史

应用推荐