当前位置: 首页> 学位论文 >详情
原文传递 融合动态场景信息和DDPG算法的智能车决策规划方法研究与应用
论文题名: 融合动态场景信息和DDPG算法的智能车决策规划方法研究与应用
关键词: 自动驾驶汽车;行为决策;轨迹规划;深度强化学习;动态场景
摘要: 自动驾驶汽车中使用的决策规划模块的目标是配合其他模块一起,让车辆可以在安全、舒适且遵守交通规则的情况下进行自动驾驶。决策规划模块通常是由两个子模块来进行实现:决策模块用于生成高层决策,来给出车辆的行为动作;规划模块生成平滑、可行驶的车辆轨迹。虽然决策和规划的研究工作已取得了很多巨大的进展,但是这些模块通常是单独开发的,适用场景较为简单。造成的结果就是,使用现有公开的决策规划方法,在动态障碍物多、道路复杂、天气环境多变的场景下就会很容易失效,出现无法输出安全、稳定的行为轨迹的情况。
  为了解决这个问题,本文结合当前网络学习算法学习适应能力强和传统方法可解释性好、能保证结果平滑的特点,提出了一种以动态环境为场景的智能车决策规划算法,侧重于车辆在直线行驶、转弯和动态交通下的决策规划任务,并且以通行效率和驾驶安全为目标。与大多数现有的仅解决决策问题或规划问题,又或者只考虑静态场景或单个障碍物移动的场景的设计思路不同,本文从决策和规划两个角度出发,分别提出在动态场景下的决策、规划解决方案,并在最后将决策方法与规划方法进行联合,在动态场景下进行决策规划算法的共同测试。本文的主要研究如下:
  (1)使用融合动态场景信息的深度强化学习方法代替传统的决策方法。本文使用免模型、可以自学习的深度确定性策略梯度(DDPG)算法作为框架,融合图像、障碍物感知结果、全局路径规划结果和车辆实时状态四种动态信息,来实现智能汽车的行为决策任务。
  (2)结合动态场景的特点对传统规划算法进行优化改进。本文使用基于多项式曲线的运动规划算法实现智能汽车的轨迹规划任务,并结合动态场景下自身车辆和障碍物的运动特点对轨迹的评价函数进行重新优化设计。
  (3)使用仿真环境和实车平台对决策规划系统进行测试验证并对实验结果进行分析。首先让第三章提出的决策算法的结果在Frenet坐标空间中进行了表示,接着利用Frenet坐标系下的决策结果作为第四章规划算法的约束,来生成Frenet坐标系下车辆的行驶轨迹。然后使用Carla仿真器生成高仿真的模拟环境以及实车平台对本文的决策规划系统进行测试验证。
作者: 周润发
专业: 仪器科学与技术
导师: 詹惠琴
授予学位: 硕士
授予学位单位: 电子科技大学
学位年度: 2021
检索历史
应用推荐