当前位置: 首页> 学位论文 >详情
原文传递 基于路径约束的智能车端到端行为决策算法研究
论文题名: 基于路径约束的智能车端到端行为决策算法研究
关键词: 智能车;自动驾驶;深度学习;端到端行为;路径约束
摘要: 随着经济全球化的快速发展和城市化的不断扩张,汽车的数量与日俱增,城市交通路网也越来越复杂。这种发展趋势导致了日益严重的交通拥堵、道路安全、空气污染等问题,迫切需要新的解决办法。近年来,在技术创新和市场需求的双轮驱动下,汽车产业也迈向智能化的发展方向。依托自动驾驶技术为核心的智能车,可以高效缓解交通拥堵、增强道路安全、减少空气污染,给汽车领域带来了重大变革,带动相关产业的发展,也为消费者带来了全新的生活方式和体验。
  传统自动驾驶方案以模块化系统为主,侧重于将驾驶任务划分为标准模块,使用基于规则的方法连接这些独立的模块。这种模块化系统需要花费大量精力来设计结合所有系统组件的架构,一旦发生错误也很容易在整个架构中传播,导致车辆在行驶中出现危险情况。本文针对行为决策算法规则库构建复杂和决策性能受限于上下层模块的问题,通过对现有技术的分析和研究,以基于深度强化学习的端到端行为决策智能体为核心,并设计场景识别模块、车辆智能体库和动作补偿模块,提出了基于路径约束的智能车端到端行为决策算法方案。
  首先,由于深度强化学习存在稀疏奖励的问题,导致端到端行为决策智能体学习效率低下。因此,在车辆智能体的模型构建中,提出了一种将路径约束融入奖励函数设计的方法。通过将路径约束中的道路中心距离和航向偏角设计为车辆引导奖惩来改进奖励机制,使车辆智能体在与环境的交互中获得高效及时的奖惩,进而加快智能体训练速度,提升训练样本利用率和智能体的决策性能。车辆智能体的状态空间充分考虑行驶状态信息中的直接相关信息和间接相关信息,采用较原始的感知信息替代难以获得的高精度信息。
  其次,由于端到端行为决策智能体的输出结果存在不可解释性,导致智能车的安全性无法得到保证。因此,本文设计了基于路径约束的动作补偿模块,针对不同的驾驶工况,根据航向偏角约束对车辆智能体行为决策的横向输出进行补偿,提升智能体决策控制的可靠性,使最终输出动作满足智能车安全性和舒适性要求。为了解决多驾驶场景的泛化性问题,设计场景识别模块对不同驾驶场景进行识别,并建立车辆智能体库,联合场景识别模块来根据不同场景自动切换车辆智能体进行端到端行为决策。
  最后,利用CARLA仿真平台完成车辆智能体的训练和调优,并通过可视化卷积特征图和类激活图对车辆智能体进行可解释性分析,有效解释了车辆智能体的工作原理及决策过程。对端到端行为决策系统设定闭环评估任务进行评估,智能车能够快速、安全、平稳的完成自动驾驶任务。通过对车辆驾驶指标的对比,验证了动作补偿模块对于保障车辆行驶安全性上的有效性,并通过两个场景决策示例的分析,验证了本文所提出基于路径约束的智能车端到端行为决策算法的有效性。
作者: 靳英豪
专业: 控制工程
导师: 赵海艳
授予学位: 硕士
授予学位单位: 吉林大学
学位年度: 2023
检索历史
应用推荐