当前位置: 首页> 学位论文 >详情
原文传递 基于博弈论的自动驾驶车辆换道决策模型研究
论文题名: 基于博弈论的自动驾驶车辆换道决策模型研究
关键词: 自动驾驶;换道决策;贝叶斯博弈;驾驶风格;换道意图
摘要: 自动驾驶在解决交通安全、交通拥堵等方面起着至关重要的作用,对自动驾驶换道机动行为的研究成为面向更高阶自动驾驶决策规划系统的重要研究内容。换道行为与其他驾驶行为相比更加复杂,换道车辆需要考虑与周围车辆之间的关系,特别是自动驾驶车辆与目标车道人类驾驶员之间的博弈关系。现有关于自动驾驶换道行为研究对真实的轨迹数据建模并观察结果,通过训练控制器来模仿人类驾驶员换道决策,但不能观察到换道过程中驾驶员交互动机。博弈论可以在没有任何长期训练过程的情况下,捕捉车辆之间的相互作用并执行相应的控制动作,为自动驾驶决策规划提供了一种解决方案。
  本文对自动驾驶换道决策过程进行建模研究,现有自动驾驶换道博弈研究将车辆间的博弈关系直接建模为策略性博弈,忽略了换道目标车道人类驾驶员的不完全信息对自动驾驶车辆博弈决策的影响。因此,本文主要研究内容是解决自动驾驶车辆换道过程中不完全信息对博弈决策的影响,以及在此研究基础上增强模型的鲁棒性问题。具体的工作安排包括以下两个方面:
  (1)提出了一种解决交通参与者间不完全信息静态博弈的贝叶斯博弈换道预测模型,该模型首先对自动驾驶车辆换道决策动作进行设计,以保证决策动作间的耦合性更低。其次,使用加速度主观感受评估模型评估换道目标车道上人类驾驶员驾驶风格信息,并将驾驶风格这类不完全信息建模为贝叶斯博弈模型状态空间中交通参与者状态的不确定性。再次,使用基于分子动力学模型的期望安全距离量化车辆的安全距离收益,还考虑了不同策略下的速度收益和由加速度直接决定的驾驶舒适度收益。最终,建立起自动驾驶车辆的贝叶斯博弈换道模型,通过模型转换求解部分再将换道模型转换为一个策略性博弈,便于求解换道模型的最优反应策略。此外,每个时间周期内还将通过置信度修正模型对比预测动作和实际动作的匹配程度修正驾驶风格评估值。实验结果表明使用贝叶斯博弈换道模型的自动驾驶车辆在决策风险控制上具有更好的效果,在合理时间范围内的换道效率也可以得到保障。
  (2)在所提贝叶斯博弈换道预测模型的基础上考虑到时空信息对车辆决策系统的影响,针对模型的鲁棒性问题提出改进措施。包括:将一维安全距离收益改进为二维安全区域收益,增加车辆防撞区、安全区、车道中心线行驶奖励。提出基于模糊逻辑的自动驾驶车辆换道意图评估模型,并将换道意图评估值和驾驶风格评估值应用于车辆动态安全区中。提出使用干扰集模型生成更多的博弈干扰位置参与博弈,以及使用最小最大策略以提供控制措施减轻最坏情况对博弈模型的干扰影响。实验结果表明在贝叶斯博弈模型的基础上使用干扰集模型和动态安全区的自动驾驶车辆不会做出偏激进或偏保守的决策动作,使自动驾驶车辆在换道决策过程中具有自适应性和鲁棒性。
作者: 李绍兵
专业: 计算机技术
导师: 胡晓辉;张军
授予学位: 硕士
授予学位单位: 兰州交通大学
学位年度: 2022
检索历史
应用推荐