当前位置: 首页> 学位论文 >详情
原文传递 基于深度强化学习的无人驾驶决策研究
论文题名: 基于深度强化学习的无人驾驶决策研究
关键词: 无人驾驶;强化学习;驾驶决策;动作空间;多智能体
摘要: 无人驾驶涉及感知、决策、控制、通信等多方面技术,是目前学术研究的热点。作为未来交通的发展方向,无人驾驶可以保证交通安全,提高通行效率,减少空气污染,为社会带来极大的经济效益。驾驶决策是实现安全、高效、和谐驾驶行为的关键,而在复杂多变的场景下学习最优决策是无人驾驶领域一直面临的挑战。强化学习作为人工智能领域研究的前沿方向,是解决无人驾驶决策控制问题的有效方法,但在样本学习效率、多场景学习能力和多智能体协作等方面有着更高的需求,也是目前面临的难点问题。为此,本文基于深度强化学习,进行了无人驾驶决策方面的研究,主要包括以下几点:
  第一,深入研究了无人驾驶行为决策算法,针对传统深度强化学习算法存在的学习效率低的问题,本文提出了融合不同动作空间输出的TD3WD(TwinDelayedDeepDeterministicPolicyGradientwithDiscrete)算法,提高了智能体的探索效率。利用预训练的网络提取图像特征代替原始图像作为状态输入,降低了强化学习训练过程中的计算成本。
  第二,针对多场景下的驾驶任务学习,设计了一种基于层次强化学习的行为决策方法,对子任务进行分类并对各子任务模型进行设计。同时,为了提高子任务的训练速度和收敛后性能,提出一种课程学习的方法分阶段学习,提高了模型的学习效率和收敛后的性能。
  第三,针对多车协同的驾驶任务学习,设计了一种基于MADDPG算法的多智能体协同决策方法,在决策时考虑各智能体之间的信息交流,通过实验表明多智能体强化学习方法可以有效提高决策的稳定性。
  第四,针对算法的实车部署,将仿真中训练收敛的模型迁移到实车上进行测试,验证了强化学习算法的有效性。
作者: 王一权
专业: 机械工程
导师: 杨璐
授予学位: 硕士
授予学位单位: 天津理工大学
学位年度: 2022
检索历史
应用推荐