论文题名: | 自动驾驶汽车多场景复杂约束轨迹规划研究 |
关键词: | 自动驾驶汽车;复杂约束;轨迹规划;强化学习 |
摘要: | 近年来,随着以人工智能为代表的新一代信息技术的蓬勃发展,汽车智能化已经成为产业发展的一个重要战略方向。自动驾驶技术有望减少由于不当驾驶行为导致的交通事故和交通拥堵,从而提高道路安全性以及通行效率,因而成为当前备受关注的研究热点之一。自动驾驶关键技术主要包括定位与感知、决策与规划、控制与执行等部分。其中,决策与规划决定了自动驾驶汽车的行为逻辑,对于整个自动驾驶系统至关重要。随着自动驾驶技术发展,简单约束下的自动驾驶汽车轨迹规划技术已经逐渐成熟,然而其工程化技术应用和产业化发展仍面临严峻的挑战,其中之一就是亟需解决更复杂约束条件下的轨迹规划难题。自动驾驶轨迹规划的约束条件与规划目标往往随着场景不同而发生变化,针对复杂约束下不同场景的轨迹规划技术进行研究,有助于聚焦特定应用场景的关键问题,从而加速自动驾驶技术在典型场景下的应用落地。 当前的轨迹规划研究多关注于单一驾驶目标的实现,而忽略了实际驾驶过程需要遵循的多种复杂约束,具体体现在以下三个方面:(1)在非结构环境下往往忽略外廓碰撞约束以及运动学约束;(2)结构化道路环境下的轨迹规划未能与决策系统形成闭环反馈,并且车道变换时占据的时间与空间仍有待优化;(3)未能充分发挥自动驾驶技术在车辆的能源效率提升上的作用。针对上述问题,本文进行了以下研究: (1)考虑到非结构化环境下的车辆轮廓约束以及运动学约束,本文提出一种基于A*算法改进的轨迹规划方法。建立全局规划与局部规划相结合的双层轨迹规划架构;通过安全冗余空间的配置避免车辆轮廓发生碰撞;对A*算法的启发函数进行改进,使得轨迹规划过程能够考虑到曲率的影响,从而提高路径的平滑度,输出的轨迹更能够满足车辆的运动学约束。 (2)针对结构化环境下缺乏决策反馈机制以及换道时间与空间优化问题,本文通过分析车辆变道过程中车道线参数的变化规律,建立了以车道线参数为参考的驾驶决策反馈机制,并且在纯追踪算法基础上,引入考虑稳定性约束的动态偏置对目标点的规划进行了优化,从而在满足汽车稳定性约束的同时缩短变道所需的时间与空间。 (3)针对动态交通流环境下的数据集存在的数据异常问题,设计了一套交通流数据清洗以及冲突轨迹重构流程。通过数据裁剪、平滑滤波以及冲突检测与重构等步骤对数据进行批量处理,以尽可能小的失真度完成对数据的处理,提升了数据质量。 (4)考虑动态交通流环境下的车辆轨迹中长时域预测需求,研究并开发了一组车辆运行轨迹预测分步组合模型。对于中长时域的轨迹预测问题进行分解,将轨迹预测问题分解成驾驶行为预测、换道时间预测以及轨迹预测三个步骤进行求解,结合长短期记忆(LongShort-TermMemory,LSTM)神经网络对各个步骤分别进行建模与训练,通过不同步骤的模型进行组合完成轨迹预测任务。 (5)针对结构化道路动态交通流环境下的经济性提升规划目标,建立了结合预测信息以及兼顾安全性、交通通行效率等多方面约束的经济型轨迹规划模型。采用近端策略优化(ProximalPolicyOptimization,PPO)强化学习方法对自动驾驶的规划策略进行了训练,得到能够兼顾多种约束的经济型轨迹规划策略网络。通过与其他方法的比较表明,本文得到的模型能够在兼顾多方面约束的同时有效降低能量消耗6.6%~7.8%。 通过上述研究,本文利用冗余安全碰撞空间的配置以及启发函数的改进,解决了非结构化环境轨迹规划易被忽略的轮廓约束以及运动学约束问题。同时,本文优化了结构化道路环境下的决策与轨迹规划方法,包括在结构化环境下建立了决策执行状态反馈机制,并在兼顾安全性约束、运动几何约束以及行驶稳定性约束情况下缩短了变道所需时间与空间。此外,在动态交通流环境下,建立了数据驱动的车周信息预测模型,并以此为前瞻信息建立了基于强化学习的经济型轨迹规划模型,能够在兼顾车辆的安全性、舒适性以及可行性等多方面约束条件下节省能量消耗。 综上,本文通过对多场景下的复杂约束轨迹规划进行分析与研究,提出并验证了各场景下满足复杂约束的轨迹规划方法,对于自动驾驶汽车轨迹规划技术在车辆实际行驶场景中的适应性提升具有重要参考价值。 |
作者: | 熊晓勇 |
专业: | 车辆工程 |
导师: | 闵海涛 |
授予学位: | 博士 |
授予学位单位: | 吉林大学 |
学位年度: | 2023 |