论文题名: | 基于深度强化学习的船舶避碰路径规划方法研究 |
关键词: | 船舶;路径规划;船舶避碰;深度强化学习;改进人工势场 |
摘要: | 随着人工智能技术的不断提高,船舶智能化已成为航运领域发展的必然趋势,而智能航行是船舶智能化进程中的核心技术。然而,现有的船舶智能航行技术难以有效的应对复杂的会遇问题,导致船舶碰撞事故屡屡发生,给船员带来严重的危害和巨大的经济损失。因此,构建更加智能的船舶航行算法并工程化应用对于提高海上交通安全、促进智能化航运的发展至关重要。深度强化学习是一种通过智能体与环境不断交互、学习和优化,并逐渐形成最佳的控制策略的一种方法,目前已在车辆自动驾驶领域取得突破性成果。本文基于深度强化学习(DQN)和人工势场法,结合船舶航行特征,开展船舶智能避碰路径规划的研究,提出一种基于DQN算法的船舶避碰路径规划方法,为船舶智能航行技术的研究开拓思路,给该领域内的相关研究提供重要参考和技术支持。本文的主要内容包括: (1)探究船舶智能航行技术的理论基础。研究传统的船舶路径规划算法,分析各算法的优劣。针对船舶避碰问题,分析船舶的会遇过程和避碰过程,并研究船舶安全距离、领域模型和碰撞危险度模型,搭建船舶会遇态势判断模型,并根据国际海上避碰规则(COLREGS)选择合规的避碰策略,为后续研究提供理论基础。 (2)构建基于DQN的船舶智能航行模型。获取船舶状态信息,计算船舶碰撞危险度和避碰相关的参数信息,构建DQN模型的状态空间。将改进人工势场法映射到DQN的动作空间中,提高船舶操作的导向性,加快模型训练速度。根据船舶航行特点,制定船舶智能决策的实时性、遵守避碰规则和航向恢复三大准则,依据准则设计DQN模型的奖励函数,最后形成基于改进DQN的船舶智能避碰路径规划算法。 (3)通过引入贝塞尔曲线来对生成的路径进行平滑处理,解决仿真实验中存在路径节点距离和转向角度过大的通病,提高了智能航行算法的精度和效率,从而保证生成路径更符合实际应用场景的要求。 (4)基于DQN智能避碰路径规划算法的路径规划和避碰仿真验证。通过改进DQN算法和传统DQN算法训练过程的对比分析,改进DQN算法模型可以缩短40%的拟合时间。并利用两次路径规划仿真实验,对比六种算法生成路径时的关键参数,验证改进算法具有优异的路径规划能力。最后,建立多种船舶会遇场景进行船舶避碰数值仿真验证,通过观察船舶运动仿真轨迹和相对距离等指标,证明本研究成果能够完成复杂的船舶避碰任务。 |
作者: | 杨长兵 |
专业: | 机械 |
导师: | 刘焕牢;张海华 |
授予学位: | 硕士 |
授予学位单位: | 广东海洋大学 |
学位年度: | 2023 |