当前位置: 首页> 学位论文 >详情
原文传递 基于Q-learning的复杂停车场路径规划研究
论文题名: 基于Q-learning的复杂停车场路径规划研究
关键词: 复杂停车场;路径规划;强化学习
摘要: 随着城市车辆占有率不断升高,城市停车困难问题难以解决。传统停车场存在停车位数量不足、智能化水平低下等问题,而城市发展要求停车场等社会公共基础设施不断完善化。相比于传统商圈的停车场,现在城市商场高楼体量正在不断扩大,为解决车位不足问题,提高空间利用率,停车场建造在往立体化发展,这意味着停车场内环境更加复杂化,驾驶员寻找车位有一定困难,对停车场路径规划的要求也变得更高,如果当前停车场内车位停满,车辆的停放需要考虑周围停车场及路面车辆交通情况。路径规划作为智能停车场的重要组成部分,能够对目前停车场出现的问题起到改善作用,通过路径规划指导车辆以最优路径行驶到目的地,在一定程度上降低车辆找车位的行驶时间,提高车辆的行驶效率,节省经济消耗。传统路径规划算法往往需要先对环境信息进行加工处理,这样难以保证算法的实时性。而强化学习可以利用智能体与环境交互,进行自我学习给出最优策略。因此,本文基于强化学习算法在停车路径规划问题上提出了以下改进方案:
  (1)为了提高停车场内多区域的路径规划算法收敛速度,提出基于动作选择优化的SL-Q(λ)算法研究,将Q学习算法与资格迹结合更新Q值计算公式,将探索概率与成功探索次数相关联,使得探索概率取值动态化,在多区域停车场环境内进行仿真实验,验证算法的可行性。
  (2)为了解决多层停车场环境导致的维度灾难问题,提出基于经验池优化的DEDQN算法研究,改进目标网络公式,增加存放能够到达最终目标点以及探索到最终位置接近目标点的有效样本的经验池,在多层约束停车场环境内进行仿真实验,验证算法的可行性。
  (3)为了解决停车场内多车辆共同停车问题以及当前停车场车位已满时需要寻找附近停车场的情况,提出基于多智能体的路径规划方法,采用将集中式学习和分布式学习结合的方式设定联合状态、联合动作以及奖赏函数,利用DEDQN算法进行实验,在多层停车场环境内实验多智能体找多目标的可行性,在多个停车场环境内实验多智能体寻找最优停车方案的可行性。
  本文对复杂停车场可能出现的问题进行研究,根据真实停车场场景搭建环境验证算法的可行性和稳定性,最后提出了其他可优化方向,为之后的研究提供参考。
作者: 韩佳妍
专业: 建筑与土木工程
导师: 吴宏杰;沈加根
授予学位: 硕士
授予学位单位: 苏州科技大学
学位年度: 2021
检索历史
应用推荐