论文题名: | 面向智能车环境感知的视觉场重构方法研究 |
关键词: | 智能车环境感知;视觉场重构方法;三维目标检测;通视分析 |
摘要: | 随着汽车产业智能化、网络化技术的发展,自动驾驶的研究及产业化应用,已成为政府部门、学术界和产业界共同关注的重点和热点,是汽车、计算机、自动化、通信与人工智能等多学科相融合的高新技术发展的重要方向。在自动驾驶技术体系中,基于视觉信息的环境感知技术是智能车路径规划、决策控制等智能行为的基础。复杂环境下的多模态、异构化的信息要素重构和空间描述更是目前智能车环境感知技术领域研究的重点课题。本论文以基于视觉信息的智能车环境感知的关键基础性问题为研究重点,构建了时空协同的多源异构信息融合的“视觉场”理论框架,提出了有效表达智能车自动驾驶状态的视觉场结构及其环境要素,深入研究了视觉场中主体车辆到环境客体目标及其之间通视性和可视域场景重建与可视化等关键技术问题,实现了视觉场空间量化式的重构方法,完成了智能车实时、准确、稳定的环境综合态势感知,实验验证了相关技术方法的有效性和工程应用价值。本文的研究工作主要有以下方面: (1)研究提出了智能车自运动估计到视觉场环境深度测量的“从运动恢复结构”的重构方法。首先,提出一种基于四有限元组的智能车自运动估计方法,创新性地将全局刚性场景分解为非刚体运动的分段切片式重构问题,构建了整个场域的高级关联特征的分片式运动的组合能量函数,并进行后反馈的闭合四环匹配和亚像素级重定位,延长了特征的跟踪寿命,提高了同名特征的时空一致性、准确性和稳定性;其次,提出增量式积分映射和树状堆栈式存储的加速运算技巧,降低了宽基线的高分辨率场景的计算复杂度;最后,提出一种基于运动约束模型的视觉场环境深度测量方法,根据智能车主体和环境客体之间的相对运动关系,构建运动约束模型,实现视觉场环境深度的测量,解决视域盲区的成像问题。实验结果表明,本文方法能够比较有效、准确、实时、稳定地重构视觉场主体智能车自运动姿态和环境三维信息。 (2)研究提出了基于多源信息融合模型的视觉场目标检测方法。首先,基于多源信息融合模型,对多源异构信息进行预融合和配准,减少了冗余数据,降低了计算复杂度;其次,利用立体区域建议的神经网络模型,限制三维目标点云的二维边界,并构造体素化的点云空间索引结构,结合点云的组合属性和几何分布特征,进行环境三维点云的超体素过分割;最后,用三维属性信息和语义上下文信息对目标周围投影的三维边界框进行定向、放置和评分,实现了视觉场环境视域的实例分割、三维目标检测、定位。实验结果表明,本文方法能够在数据稀疏、小目标、目标遮挡或目标堆叠的情况下,能够比较高效、准确、稳定地重构出视觉场环境中的客体目标信息。 (3)研究分析了视觉场主体到环境客体之间的通视性,提出了基于流体动力模型的视觉场通视分析方法。首先,将二维图像和环境重构的三维点云进行多维点坐标的数据对齐,估计出运动观场,获得视点位置和有效视线范围内的视域点云;其次,将点云计算从欧式空间转换到黎曼空间,设计基于流体动力模型的黎曼度量,并构造出点云的流形辅助面,解决了原始海量点云的空间不连续、分布不均匀等问题,使得点与点之间的距离关系计算更加准确;最后,为流形辅助面进行有限元拓扑结构的谱图分析,提出混合平面计算结构的几何计算条件作为高程值的分析判据,实现了动态视点之间的通视分析。实验结果验证了该方法能够比较有效、动态、稳定地重构出视觉场主体与环境客体之间的通视性。 (4)研究提出了基于特征链码模型的视觉场信息重构与可视化方法。首先,通过初始化视觉几何模型,标定重构方法的畸变校正、极线校正及刚体运动变换等参数;然后,建立特征链码模型,提出基于特征链码重采样的场景重构,并均匀提取不同纹理粗细度和深度变化的区域特征,以特征细节化方式实现视觉场环境信息的三维点云重构;其次,使用点云统计滤波器和最近邻配准进行离群点和异常值的去除,并将帧间相邻运动状态的重构点云融合配准在同一坐标系;最后,利用周边多级渐变纹理的双线性组合方式,对三维点云的网格骨架进行纹理映射,即点云表面重建,实现视觉场环境的场景渲染及漫游的可视化效果。实验结果表明,该技术方法具有重建纹理均匀、细节响应丰富等特点,能够提高智能车宽基线场景的实时场景重建与可视化的要求。 |
作者: | 白羚 |
专业: | 计算机科学与技术 |
导师: | 李银国 |
授予学位: | 博士 |
授予学位单位: | 重庆邮电大学 |
学位年度: | 2022 |