论文题名: | 基于强化学习的自动驾驶汽车轨迹规划与控制方法 |
关键词: | 自动驾驶;强化学习;策略梯度算法;轨迹规划;跟踪控制 |
摘要: | 随着汽车产业的发展,自动驾驶技术正广受国内外学者的关注。自动驾驶轨迹规划和控制方法作为自动驾驶技术中承上启下的关键技术,是自动驾驶的安全保障。传统的自动驾驶轨迹规划和控制方法一般是基于规则和人工经验实现,存在以下几个难点:(1)需要尽可能考虑各种工况,算法设计复杂;(2)很难兼顾复杂的环境而做出正确的决策和动作,泛化性不足;(3)较难实现闭环反馈,不能进行自我完善。因此,传统的自动驾驶轨迹规划和控制方法很难满足复杂工况下的自动驾驶需求。本文依托“国家自然科学基金联合基金重点项目”等课题,针对基于强化学习的自动驾驶轨迹规划与控制方法的相关内容进行深入研究,论文的主要创新工作如下: (1)设计了一种基于策略梯度算法的轨迹规划方法,提高自动驾驶车辆行驶效率,解决了复杂路况和密集车流情况下轨迹规划难度较大的问题;提出了与策略梯度算法相配合的时空鸟瞰图作为强化学习的状态量,加强了策略网络特征提取的能力,解决了因特征不充分导致网络收敛困难的问题;构建了基于策略梯度算法的自动驾驶轨迹规划模型,实现了交通环境、规划算法和控制算法三者的有效耦合,使得规划算法输出轨迹能有效的适应车辆的动力学特性和控制算法。 (2)提出了一种基于Actor-Critic算法和预瞄跟踪模型的多任务强化学习轨迹跟踪方法,使得自动驾驶车辆在全速域、多种曲率工况下的横向和纵向跟踪效果以及控制的稳定性得到进一步改善;针对强化学习智能体在前期的训练过程中较难平衡“探索”与“利用”之间的矛盾,设计了一种多头网络结构,利用自适应的动作噪声方式增强了网络收敛的鲁棒性,提高了强化学习网络的收敛速率;同时,针对高密度多车道的交通场景下,设计了一种基于DQN算法训练的决策模型,有效提高了多车道场景下的行车效率。 (3)最后,利用CARLA仿真模拟器构建的多个场景下对所提方法进行了验证和对比实验。结果表明,所提方法有效的提高了任务的平均完成度。 |
作者: | 杨绍卿 |
专业: | 车辆工程 |
导师: | 蔡英凤 |
授予学位: | 硕士 |
授予学位单位: | 江苏大学 |
学位年度: | 2022 |