论文题名: | 基于Sarsa学习算法的路径诱导算法研究 |
关键词: | 路径诱导系统;Sarsa学习算法;多层网方法;智能交通系统 |
摘要: | 近几十年来,随着我国城市机动化和城镇化的加快,城市遭遇了许多交通问题,如交通拥堵、交通安全、交通污染等。在城市地区,交通拥堵是最为普遍的交通问题,许多学者对解决城市交通拥堵问题作出了努力并提出了多种解决方案。其中,智能交通系统(ITS)是一种有效的解决交通问题的系统。 作为智能交通系统的重要研究方面,中心式动态路径诱导系统是目前公认的提高交通效率、缓解交通拥堵的最佳途径。由于交通系统复杂多变、影响因素众多、路网规模庞大,基于精密交通流数学模型的路径诱导的实施困难极大,对于数学模型要求较低的智能技术是目前行之有效的方法。为此,本文利用人工智能手段中的强化学习策略来建立中心式动态路径诱导策略。首先,我们设计基于Sarsa学习的在线的动态路径诱导模式来优化路网的整体使用效率。其次,从整个交通系统的角度出发,并考虑到交通系统的中各个局部交通环境的区别提出了基于全局和局部联合控制策略作为Sarsa学习的行为选择函数。最后,为了解决大规模路网中 Sarsa学习寻优困难的问题,采用基于进化的聚类技术划分原始交通网来建立多层次网络,使得基于多层网络的动态路径诱导算法可以很快的收敛。 本文在研究路径诱导算法的基础上,将中心式路径诱导系统、强化学习、全局和局部联合控制策略以及多目标遗传算法聚类生成多层网的研究特色融合在路径诱导算法中,尤其是应用了强化学习中的适合在动态系统中在线学习的Sarsa学习算法。实验结果显示,本文提出的基于Sarsa学习的路径诱导算法不但可以减少交通系统中车辆的平均行驶时间,还能减少系统中的拥堵现象,提高了交通系统的效率。并且,本文在该算法的基础上,分别从强化学习的行为选择函数和“状态―>行为”搜索空间的角度进行了改进,实验结果显示,这些算法进一步的提高了交通系统的效率。 |
作者: | 王星乔 |
专业: | 计算机软件与理论 |
导师: | 文峰 |
授予学位: | 硕士 |
授予学位单位: | 沈阳理工大学 |
学位年度: | 2016 |
正文语种: | 中文 |