当前位置: 首页> 学位论文 >详情
原文传递 基于元学习的欠驱动无人艇建模与控制
论文题名: 基于元学习的欠驱动无人艇建模与控制
关键词: 无人艇;控制系统;元学习;神经网络;轨迹跟踪
摘要: 随着科学技术的发展,陆地上的资源大量地被使用殆尽,因此人们将目光投到了远超陆地面积且蕴藏许多资源的海洋,而无人海洋装备是各个国家开发和利用海洋的关键。在过去的数十年中,无人艇由于其灵活性强、体积小、速度快和成本低等特点,受到了各国研究人员的青睐。元学习是一种机器学习方法,传统的深度学习方法都是从头开始学习一个模型,而元学习强调从无人艇的多种环境来学习一个对未知环境具有良好的泛化能力的模型,关键是学习神经网络的初始参数,使无人艇具备学会学习的能力,在新环境中具有建模过程简单、控制灵活的特征,因此元学习在无人艇执行军事民用任务时具有重大的应用前景。
  本文基于元学习方法,研究了无人艇的运动建模与运动控制问题。研究内容如下:
  第一,针对模型完全未知的无人艇系统,提出了一种基于元学习的无人艇建模方法。将海洋环境中风对无人艇的影响作为其主要扰动,不同的风速和方向代表不同的环境。通过分析前馈神经网络和循环神经网络这两种常用的神经网络,确定了前馈神经网络的拓扑结构和主要参数。建模过程中,通过采集无人艇在多种不同环境中的航行数据,利用梯度下降法设计了针对深度神经网络初始参数的学习,进而得到对未知环境最有利的模型参数,当遇到新环境时无人艇微调神经网络参数便完成了建模。最后仿真验证了所提出的无人艇建模方法的有效性。
  第二,针对模型完全未知的无人艇轨迹跟踪控制问题,提出了一种基于元学习的欠驱动无人艇轨迹跟踪控制方法。将元学习与滚动预测控制结合,基于元学习得到的神经网络预测模型,确定了无人艇运动过程中的预测方程。随机的产生一系列候选控制输入序列,已知无人艇当前状态信息和环境信息,依据预测方程得到一系列候选轨迹序列,设计控制器中的奖励函数,进而得到待优化的目标函数。利用Random-samplingShooting方法求解目标函数,使无人艇跟踪期望轨迹时每一步都可以执行最优的控制输入。最后仿真验证了所提出的无人艇轨迹跟踪控制方法的有效性。
  第三,针对模型完全未知的无人艇路径跟踪控制问题,提出了一种基于元学习的欠驱动无人艇路径跟踪控制方法。基于元学习得到了神经网络预测模型,根据无人艇的当前状态和环境扰动做出行为预测,得到未来时刻的候选路径序列。设计控制器中的奖励函数,计算出每条候选路径序列的累积奖励,借助于Random-samplingShooting方法得到最优的控制输入,不断更新无人艇的状态信息。最后在无人艇跟踪直线和曲线上,仿真验证了所提出的路径跟踪控制方法的有效性。
作者: 张宝
专业: 电气工程
导师: 彭周华;王丹
授予学位: 硕士
授予学位单位: 大连海事大学
学位年度: 2021
检索历史
应用推荐