专利名称: |
基于策略迭代的智能汽车转向控制方法 |
摘要: |
本发明属于车辆自动驾驶技术领域,具体涉及一种基于策略迭代的智能汽车转向控制方法,旨在解决如何提高无人驾驶智能汽车在转向控制上的在线自主学习能力的问题。为此目的,本发明中基于策略迭代的智能汽车转向控制方法包括:采集车辆的行驶状态数据和车辆控制量;转向控制网络模型依据当前采集时刻的行驶状态数据和车辆控制量,预测下一采集时刻的行驶状态数据;基于判断机制控制转向控制网络模型的在线训练;以转向控制网络模型作为被控制对象,基于评价网络和执行网络实现策略迭代算法,得到优化后的执行网络;基于执行网络输出的车辆控制量控制智能汽车的转向。本方法提高了模型训练的实时性以及对当前环境的适应性。 |
专利类型: |
发明专利 |
国家地区组织代码: |
北京;11 |
申请人: |
中国科学院自动化研究所 |
发明人: |
汤淑明;卢晓昀;朱海兵;杜清秀 |
专利状态: |
有效 |
发布日期: |
2019-01-01T00:00:00+0800 |
申请号: |
CN201810597914.9 |
公开号: |
CN108909833A |
代理机构: |
北京瀚仁知识产权代理事务所(普通合伙) 11482 |
代理人: |
郭文浩;陈晓鹏 |
分类号: |
B62D6/00(2006.01)I;B62D15/02(2006.01)I;G06N3/08(2006.01)I;B;G;B62;G06;B62D;G06N;B62D6;B62D15;G06N3;B62D6/00;B62D15/02;G06N3/08 |
申请人地址: |
100190 北京市海淀区中关村东路95号 |
主权项: |
1.一种基于策略迭代的智能汽车转向控制方法,其特征在于包括:采集车辆的行驶状态数据和车辆控制量;转向控制网络模型依据当前采集时刻的行驶状态数据和车辆控制量,预测下一采集时刻的行驶状态数据;所述转向控制网络模型为经预设的训练数据集离线训练后的神经网络模型;依据预设时间长度内采集得到的各行驶状态数据与转向控制网络模型预测的对应的下一采集时刻的行驶状态数据,计算对比函数值;若所述对比函数值大于预设的阈值,则将所述预设时间长度内采集得到的行驶状态数据和车辆控制量加入所述预设的训练数据集,并基于该训练数据集对转向控制网络模型进行在线训练;以转向控制网络模型作为被控制对象,基于评价网络和执行网络实现策略迭代的自适应动态算法,获得优化后的执行网络;基于执行网络输出的车辆控制量控制所述智能汽车的转向。 |
所属类别: |
发明专利 |