题名: | 一种基于深度强化学习的船舶智能避碰方法 |
作者: | 陈立家;孙中泽;黄立文;许毅;李胜为 |
作者单位: | 武汉理工大学航运学院;内河航运技术湖北省重点实验室;武汉理工大学计算机科学与技术学院 |
关键词: | 深度强化学习;D3QN;船舶避碰;船舶领域;智能决策 |
摘要: | 文中提出了一种基于深度强化学习(deep reinforcement learning, DRL)的船舶智能避碰方法。该方法利用D3QN(double deep q-learning network with dueling architecture)算法与船舶领域模型,结合《国际海上避碰规则》(COLREGs)的避碰操作规范设计奖励函数,通过时序差分法实现优先经验回放,构建自主避碰的智能体。通过ROS-gazebo搭建仿真环境,构建神经网络处理环境中的视觉与雷达数据,快速有效地获取环境特征信息。结果表明:对比传统DQN算法,该方法具有更好的决策能力,训练时间更短;在避碰过程中可以对会遇局面做出正确的判断,选择符合COLREGs规范的避碰动作,最终可以准确并及时的避让目标船。 |
期刊名称: | 武汉理工大学学报(交通科学与工程版) |
出版年: | 2023 |
期: | 01 |
页码: | 191-196 |