当前位置: 首页> 学位论文 >详情
原文传递 面向汽车零件盘点的视觉物体计数
论文题名: 面向汽车零件盘点的视觉物体计数
关键词: 汽车零件;数据成本;计数精度;视觉物体计数
摘要: 物体计数是计算机视觉中的重要任务,具有广泛的应用。当前流行的视觉物体计数方法多为基于深度学习的方法,大量训练数据标注成本高、计数精度较差。本文针对汽车零件计数问题,采用ArUco(AugmentedRealityUniversityofCordoba)标记降低标注成本,并对现有计数网络LC-FCN(Localization-basedCountinglossFullyConvolutionalNetwork)引入了尺度信息,提升了其精度。具体工作如下:
  设计了一种利用ArUco对大量视频数据的标注生成方法。与现有的半自动标注方法相比,本方法所需的人工干预程度更低,可在短时间内生成大量的标注;与常规的数据增强、三维虚拟生成、对抗神经网络生成等虚拟生成方法相比,本方法使用实际图像,能够更准确地反映现实场景中的光照条件、物体外观等。最后,采集了12类汽车零件近7万张图像数据,利用该标注方法进行了标注,制作了汽车零件数据集。
  针对现有计数网络LC-FCN计数精度不足的问题,通过分析网络训练时热图演变的过程,发现了传统方法对物体尺寸无法自适应的问题。并基于引入尺度信息的思路,提出了两种引入尺度信息的方法:感受野匹配、将点标注转化为自适应的区域标注。
  在汽车零件数据集对两种引入尺度信息的改进网络进行对实验比较,采用了鲁棒性更高的自适应区域标注方法作为改进方法。最后,将改进后的LC-FCN与其他五种算法进行了横向比较。在12类汽车零件数据集中,改进后的LC-FCN对其中9类零件的计数精度达到最高。
作者: 梁鸿泽
专业: 机械工程
导师: 管贻生
授予学位: 硕士
授予学位单位: 广东工业大学
学位年度: 2022
检索历史
应用推荐