论文题名: | 基于逆强化学习的舰载机牵引车路径规划研究 |
关键词: | 航空母舰;甲板作业;舰载机牵引车;路径规划;逆向强化学习 |
摘要: | 舰载机牵引车是航母甲板上重要的“工程车辆”,对舰载机有效利用航空燃油起着关键作用;在非起飞状态下的舰载机舰面运动中,无论是舰面调运,还是进出机库的运动,都将由舰载机牵引车配合完成。舰载机牵引车在航母这样的特殊环境中,需要应对不同的作业任务,适应不同的海况条件,能够依靠自身能力,平稳地牵引飞机并准确到达指定位置,这些非常规的使用环境和作业条件造就了舰载机牵引车的与众不同。随着常规无人车研究的深入,舰载机牵引车的无人驾驶技术研发也将成为未来的发展趋势,这对提高牵引车作业效率,保障人员安全具有重要意义;因而,对舰载机牵引车在舰面有限空间内的动态路径规划将是实现这一技术的关键。 本文以航母甲板上的作业车辆——舰载机牵引车为研究对象,在总结和分析以往路径规划研究方法的基础之上,选用能更好适应驾驶环境、不需要已知报酬函数,通过对演示轨迹进行学习从而得出报酬函数进而得出最优路径的逆向强化学习方法来研究舰载机牵引车路径规划问题。 首先,本文对以往的路径规划进行了介绍。在分析总结这些方法的基础之上,结合航母甲板动态作业环境的特点,采用马尔可夫决策过程(Markov Decision Processes,MDP)对牵引车作业建立模型。 其次,提出了基于逆向强化学习的方法,建立了一套符合舰载机牵引车路径规划要求的逆向强化学习机制,包括:特征值、驾驶风格、权值等。 再次,分别对舰载机牵引车的动力学模型、虚拟传感器模型、甲板及障碍物模型进行了建模,开发了一款舰载机牵引车驾控仿真系统。在该平台上进行了仿真驾控实验。 最后,通过对不同驾驶风格的仿真实验证明在舰载机牵引车路径规划问题中使用逆向强化学习方法的正确性和有效性。 |
作者: | 刘珏 |
专业: | 机械工程 |
导师: | 王能建;卢永锦 |
授予学位: | 硕士 |
授予学位单位: | 哈尔滨工程大学 |
学位年度: | 2017 |
正文语种: | 中文 |