当前位置: 首页> 学位论文 >详情
原文传递 基于自主和自学习行为智能体的AUV运动规划研究
论文题名: 基于自主和自学习行为智能体的AUV运动规划研究
关键词: 自学习行为;自主行为智能体;AUV运动规划;水下无人潜器;水下机器人;动态不确定;自主控制
摘要: 本论文以国家重大基础研究项目“水下无人潜器技术”为背景,对基于行为主义的智能体技术在自治式水下机器人(Autonomous underwatervehicle,简称AUV)运动规划中的应用展开了深入地研究。论文的研究旨在提高AUV自主作业过程中对环境的适应性、反应的快速性以及决策的有效性。 论文主要完成以下的研究工作: 针对动态不确定环境下的AUV运动规划问题,将智能体的行为看作是AUV和环境之间交互的一个动态变化的过程,提出并阐释了行为动力学方法,并利用该方法建立了AUV水平面的自主行为智能体。仿真结果表明自主行为智能体对非结构环境响应快速,正确、有效。 垂直面运动规划对AUV下潜深度及距底高度均有特殊要求,而单独的定高航行或定深航行难以同时满足。本文建立了基于模糊推理的AUV垂直面自主行为智能体,对定高航行行为和定深航行行为进行融合。仿真结果说明垂直面自主行为智能体在保证AUV自身安全的同时,尽可能满足了声学仪器对距底高度的要求,此外正常航行时AUV不随海底地形起伏而频繁改变深度,使得航行稳定。 为了对AUV空间运动规划中水平面和垂直面自主行为智能体进行协调,提出了基于使命分解和任务执行语句的行为协调机制。该机制的原理是:将使命分解成若干个能够顺序执行的任务,针对特定任务定义任务执行语句,任务执行语句将任务转换为并发的自主行为智能体,再按照优先级规则对并发行为进行协调。进行了仿真验证,结果证明提出的自主行为智能体及协调机制正确、可行。 针对传统强化学习方法应用于AUV工程实际的不足,如学习的泛化性差、试错带来的风险性以及学习效率低等,提出了基于神经网络和案例的Q学习算法(NCQL)。NCQL的基本思想是用神经网络解决Q学习的泛化问题;用案例学匀保证学习过程的收敛性、避免试错的风险及提高学习效率。给出了基于NCQL的AUV自学习行为智能体各要素的实现方法。进行了仿真,仿真结果可以看出,提出的NCQL算法收敛性能好、收敛速度快并且收敛到的结果较优化。NCQL算法具有在线学习和自适应学习的特点。 论文从自主控制体系结构顶层设计要求出发,设计了含行为智能体的混合式AUV自主控制系统。采用有色Petri网(CPN)作为工具,对所提出的结构进行了形式化建模,利用CPN的数学理论分析了模型基本特性,包括有界性、活性和互斥性。形式化分析验证了AUV自主控制体系结构以上性质的正确性和有效性。 为了综合验证本文所提出的各主要方法,分别进行了声呐湖上试验、缩尺度模拟试验和半实物仿真试验。本文从声学传播和声呐物理特性考虑,提出了一种数字滤波算法,对多波束前视声呐探测到的数字信号进行后处理。设计了基于声呐信息的避障试验方案,进行了避障行为动力学模型的湖上试验验证。设计了AUV缩尺度模拟试验,应用激光测距仪模拟AUV前视声呐传感器,完成了不同案例下的水平面行为智能体功能的有效验证。利用半实物仿真平台对含行为智能体的AUV自主控制系统进行了仿真试验。通过反复试验,进一步说明了本文所提方法正确、可行。基于自主和自学习行为智能体的运动规划研究对于AUV安全、高效地完成远程航海与地形勘察自主作业使命,具有重要的理论意义和实用价值。
作者: 秦政
专业: 控制理论与控制工程
导师: 边信黔
授予学位: 博士
授予学位单位: 哈尔滨工程大学
学位年度: 2007
正文语种: 中文
检索历史
应用推荐