论文题名: | 基于深度强化学习的东京湾渡轮避碰决策算法 |
关键词: | 船舶避碰;避碰决策;深度强化学习;DDQN算法 |
摘要: | 船舶避碰是船舶航行安全的核心问题,深度强化学习算法在船舶避碰领域有着广泛的应用前景,提高了船舶在航行环境中的灵活性和适应性。本文以深度强化学习中的DDQN(DoubleDeepQNetwork)算法为核心,提出了一种适用于东京湾危险水域的船舶避碰决策算法,有效的提高了该水域的航行安全。本文的主要研究内容如下: (1)对船舶避碰领域已有的研究成果进行分析,详细的介绍了深度强化学习的基本原理,及其在船舶避碰问题中的优势。对于当前深度强化学习算法在船舶避碰领域研究的不足之处,本文提出的船舶避碰决策算法从应用性、及时性和过程性三个方面进行相应的改进。 (2)构建了高度真实的船舶仿真模型。该模型通过船舶自动识别系统(AutomaticIdentificationSystem,AIS)收集和提供船舶航行数据,嵌入东京湾渡轮Bumper模型用于判断与指示船舶之间的安全距离,遵守日本海上交通安全法的相关法规规范来限制会遇场景下渡轮与他船之间的航行行为。 (3)设计了船舶避碰决策算法。分别从状态空间、动作空间、奖励函数和网络结构四个方面进行详细设计,组建了船舶避碰决策算法框架。利用python语言建立船舶避碰仿真模型后,将不同危险会遇局面下的船舶AIS数据作为模型的输入,经过DDQN神经网络的不断训练,得到各避碰局面下的船舶自动避碰策略,并将其存储到数据库中。对于训练结果,本文展示了两船与多船会遇局面下,船舶随着训练次数的增加,不同奖励值情况下的船舶航行路径。 (4)将实际航行数据应用到船舶避碰仿真模型中。验证实验表明,根据实时AIS信息,数据库可以为驾驶员提供对应的航行策略,使渡轮能够安全有效的进行避碰并到达目标点,为东京湾渡轮航线的运营提供了新的策略。 本文针对东京湾浦贺水道南侧入口处危险水域的船舶避碰问题,提出了基于DDQN深度强化学习算法的东京湾渡轮避碰决策算法。以东京湾地理环境和海量AIS数据为支撑,构建了船舶仿真模型和设计船舶避碰决策算法框架,将该水域一年内所有具有碰撞风险的场景进行训练,得到相应的最优避碰策略,并通过验证实验表明该算法能够解决该危险水域的船舶避碰问题,有效的降低了碰撞风险,具有很好的应用价值。 |
作者: | 武超洋 |
专业: | 交通运输工程 |
导师: | 关巍 |
授予学位: | 硕士 |
授予学位单位: | 大连海事大学 |
学位年度: | 2022 |