题名: |
基于自学习和监督学习混合驱动的智能汽车跟驰控制策略 |
作者: |
赵健;宋东鉴;朱冰;刘斌;陈志成;张培兴 |
作者单位: |
吉林大学汽车仿真与控制国家重点实验室;中国第一汽车集团有限公司智能网联开发院 |
关键词: |
汽车工程;跟驰控制;自学习;监督学习;深度强化学习;数据驱动 |
摘要: |
随着人工智能技术的不断进步,越来越多的数据驱动方法被用于解决智能汽车跟驰控制问题,基于此,提出一种自学习和监督学习混合驱动的跟驰控制策略,实现拟人化的高性能跟驰控制。首先,基于实车试验平台采集跟驰数据,将跟驰控制问题建模为马尔可夫决策过程,利用深度强化学习中的深度确定性策略梯度建立自学习跟驰控制策略,基于长短期记忆网络对马尔可夫决策过程的状态转移进行建模,根据历史数据对未来状态进行预测,利用高斯混合回归和连续隐式马尔可夫模型建立具有人类驾驶人特性的跟驰参考模型并将其引入强化学习架构中。提出一种自学习和监督学习的混合架构,通过引入人类驾驶人跟驰参考模型引导强化学习正确学习人类驾驶人特性,提升策略拟人性;通过对马尔可夫决策过程状态转移建模使策略进行加速度决策时能够考虑跟驰过程的状态随机性。最后利用实车跟驰数据进行策略验证,对提出策略和监督学习策略的跟驰控制性能进行对比并给出一系列量化评价指标。研究结果表明:所提出策略在跟踪前车速度和保持理想跟驰距离上具有超越人类驾驶人的表现,并有效降低了跟驰过程中的加速度冲击,在保证跟驰安全性、跟踪性、舒适性的同时具备较好的拟人性。 |
期刊名称: |
中国公路学报 |
出版日期: |
202203 |
出版年: |
2022 |
期: |
03 |
页码: |
55-65 |