当前位置: 首页> 学位论文 >详情
原文传递 高速公路匝道合并区智能车辆运动规划策略研究
论文题名: 高速公路匝道合并区智能车辆运动规划策略研究
关键词: 智能车辆;运动规划;深度强化学习;高速公路;匝道合并区
摘要: 对于自动驾驶汽车来说,提供一个安全、高效和舒适的运动规划策略仍然具有挑战性。目前,大多数的主流方法,例如模型预测控制(Model Predictive Control, MPC)在复杂的交互环境中经常失败,这是因为它们没有考虑自车和附近交通参与者之间的交互,并且这种算法的时间复杂度对于车载计算设备来说很高。作为替代方案,深度强化学习(Deep Reinforcement Learning, DRL)可以学习如何与周围环境进行最佳交互,而无需对附近车辆驾驶员的行为建立明确的模型,并且因为几乎所有计算都可以离线执行,所以能够在实时情况下提供最佳控制。然而,基于DRL的解决方案缺乏可解释性,可能会阻碍其在工业量产自动驾驶车辆任务中的大规模应用。此外,DRL方法往往是不安全的,并且对于训练中没有遇到的场景很脆弱。在此背景下,本文提出了一种新的基于DRL的运动规划方法,该方法明确考虑了可解释性和鲁棒性。具体而言,与传统的基于DRL的解决方案不同,传统解决方案以端到端的方式从感知到控制执行,这项工作通过添加不确定性感知区间预测来计算在规划时间范围内车辆可以达到的状态集,从而将运动规划层与端到端解决方案解耦。在此基础上,详细介绍了一种鲁棒控制框架,该框架旨在以系统的最坏性能保证安全。为了验证所提出的算法,在城市交通模拟器(Simulation of Urban Mobility, SUMO)中模拟了自动驾驶车辆入口匝道汇入高速公路的任务。结果表明,所提出的运动规划方法结合了基于优化和DRL方法的优点,在舒适性、计算效率、可解释性和鲁棒性方面达到了平衡。本论文的主要研究内容如下:
  1) 与传统的基于DRL的解决方案不同,传统的DRL解决方案通常采用人工神经网络的形式,因此很难知道所有单个神经元如何协同工作以获得最终输出,这项工作通过添加不确定性感知预测模型,将运动规划层在端到端解决方案中进行解耦。通过将预测时间范围内可能达到的一组状态滚动到S-T空间,可以生成并可视化附近交通和控制车辆的轨迹。该S-T图可以帮助评估运动规划的轨迹是否长期安全,从而提高基于DRL的方法的可解释性。
  2) 考虑到基于DRL的方法通过近似样本的期望值来解决自动驾驶汽车控制问题以及业界常见的模拟到实际差距的问题,基于DRL的策略在理论和实践上都没有严格的安全保障。为了确保安全性能,在考虑车辆动力学约束的同时,在上述DRL基础上,提出了一种鲁棒控制框架,确保附近交通系统的最坏情况下的安全性能。
作者: 江磊
专业: 车辆工程
导师: 胡博
授予学位: 硕士
授予学位单位: 重庆理工大学
学位年度: 2023
检索历史
应用推荐