论文题名: | 内河船舶相对位姿与场景深度估计方法研究 |
关键词: | 内河船舶;相对位姿;场景深度;估计方法 |
摘要: | 环境感知是智能船舶研发的基础,船舶通过传感器采集并处理环境数据,获得环境边界与障碍物的信息,即场景深度信息,才能进一步给出对应操作,另外针对船舶个体进行相对位姿监测,对于船舶的异常运动、整体轨迹变化观察等有重要意义。现有的环境感知方法往往依赖于不同类型的数据采集设备,如图像传感器、惯性传感器、三维传感器等。多模态融合方法往往存在系统复杂性高与成本高的问题,因此基于单传感器感知的方法存在具有必要性。图像传感器采集的数据通常为二维格式,但可以通过加入前后的相关性,进行多维度信息的生成与分析。除此之外,船舶数据集的缺乏也是一个很大的挑战。本文以内河船舶图像作为研究对象,基于卷积神经网络,使用场景深度与船舶相对运动的估计结果进行互相监督,从而实现深度与位姿的估计。本文的主要研究工作如下: (1)基于现有船舶相关研究存在数据缺乏的问题,分析了现有的位姿与深度估计方法,提出采用基于损失约束的方法对内河船舶位姿与深度进行估计。可在不需要标签文件的情况下对网络进行训练,使用两条支线网络的结果基于光度重建误差进行互相监督。在估计网络中引入了基于光度重建损失的自适应性鲁棒性损失函数,应用动态的损失函数来改善网络估计的准确性。并建立小型的以视频和图像为主的船舶数据集,包括船舶模型和船舶实景的拍摄。 (2)通过使用倒残差与深度可分离卷积的结合的结构来对船舶相对位姿与场景深度特征提取网络结构进行改进,并减少整体网络的参数量。另外通过添加特征通道处理模块来解决因组卷积模块的使用而导致的特征间相关性较差的问题,并基于公共数据集和自采集数据集进行实验验证结构的有效性。分析了位姿在船舶六自由度运动中的表达,通过比较选择旋转向量结合平移向量生成转换矩阵来进行位姿表达。 (3)针对船舶图像数据采集过程中,传感器发热、雨雾天气等原因造成的图像画质低的问题,本文提出通过阈值收缩方法结合Gamma变换来提高归一化深度定量估计的准确性。对于深度估计网络使用了不同结构的主干网络进行实验,在参数量和准确率之间寻找平衡。基于注意力机制模块改进深度估计网络的准确性,基于定性和定量实验进行结果比较。在KITTI数据集和自采集数据上进行结果检验。从结果来看,改进后的方案在准确率上有所提高。 |
作者: | 林典 |
专业: | 信息与通信工程 |
导师: | 杨杰 |
授予学位: | 硕士 |
授予学位单位: | 武汉理工大学 |
学位年度: | 2021 |