专利名称: |
一种基于机器视觉的船舶水尺读数检测和识别方法 |
摘要: |
本发明公开一种基于机器视觉的船舶水尺读数检测和识别方法,涉及图像处理技术领域;而本发明包括S1采集过往船舶水尺区域画面、S2建立船水分界线、S3船舶水尺刻度预测及标注、S4获取精准的待预测区域、S5对待预测区域进行字符预测;本发明中,首先对船舶水尺读数分别标注整数与小数部分的策略能够避免复杂的后处理算法逻辑,面对拍摄角度倾斜或船体弯曲的情况仍然具有较高的准确率和鲁棒性,在实际应用过程中随着训练数据的不断扩充,YOLOv5目标检测算法对水尺的整数与小数部分的检测准确率将不断提高,其次,本算法引入Mask RCNN实例分割算法对船舶和水域进行划分,无论实际场景的水体浑浊与否均能够保证待预测区域的准确性。 |
专利类型: |
发明专利 |
国家地区组织代码: |
江苏;32 |
申请人: |
南京积图网络科技有限公司 |
发明人: |
高正华;徐浩东 |
专利状态: |
有效 |
申请日期: |
2023-08-10T00:00:00+0800 |
发布日期: |
2023-11-10T00:00:00+0800 |
申请号: |
CN202311003627.8 |
公开号: |
CN117037132A |
代理机构: |
北京新之崛知识产权代理事务所(普通合伙) |
代理人: |
李琴 |
分类号: |
G06V20/62;G06V10/26;G06V30/148;G06V30/19;G06V10/764;G06V10/44;G06V10/52;G06V10/762;G06V10/82;G06N3/0464;G06N3/048;G;G06;G06V;G06N;G06V20;G06V10;G06V30;G06N3;G06V20/62;G06V10/26;G06V30/148;G06V30/19;G06V10/764;G06V10/44;G06V10/52;G06V10/762;G06V10/82;G06N3/0464 |
申请人地址: |
210000 江苏省南京市秦淮区永丰大道8号南京白下高新技术产业园区软件信息中心A栋101室 |
主权项: |
1.一种基于机器视觉的船舶水尺读数检测和识别方法,其特征在于,包括以下步骤: S1、通过无人机或码头固定监控相机采集过往船舶水尺区域画面,图像采集应保证光线充足,水尺刻度和船水分界线清晰可见; S2、利用Mask-RCNN模型对船舶区域和水域进行实例分割得到船水分界线; S3、以“M”为单位,用阿拉伯数字表示整数与小数部分,采用YOLOv5目标检测算法分别对船舶水尺刻度的整数部分和小数部分进行预测,得到水尺读数的边界框坐标位置以及每个边界框的所属类别,整数部分记为“int”类,小数部分记为“float”类; S4、以原始图像的左上角为坐标原点,在“int”类和“float”类目标中分别找出中心点y轴坐标最大的目标边界框即为有效读数区域,该区域将联合S2得到的船水分界线进一步得到更加精准的待预测区域; S5、通过OCR算法对待预测区域进行字符预测,保证水尺读数预测的准确性,避免水面波动对预测的干扰,在实际推理中取10s内检测到的所有水尺读数并取均值作为最终的预测结果。 2.如权利要求1所述的一种基于机器视觉的船舶水尺读数检测和识别方法,其特征在于,S3中,在这样的标注策略下,不同类别的目标边界框具有不同的大小和宽高比,便于后续YOLOv5目标检测算法在不同的预测特征图中对目标进行预测。 3.如权利要求1所述的一种基于机器视觉的船舶水尺读数检测和识别方法,其特征在于,S3中,YOLOv5属于Anchor-Based的目标检测算法,即需要利用先验的锚框(Anchor Box)进行回归预测,其基本原理是通过预处理操作将输入的图像缩放到模型所需的尺寸大小,在此基础上利用一系列卷积、批归一化和激活函数对图像进行特征提取并下采样至8倍、16倍和32倍,由于下采样的倍率不同,通常在小尺寸的预测特征图中预测训练集中的大型目标,而在大尺寸的预测特征图中预测小型目标。 |
所属类别: |
发明专利 |