论文题名: | 基于深度学习的交通文本检测和识别方法的研究 |
关键词: | 交通文本检测;四边形回归;空间变换网络;CTC损失函数 |
摘要: | 交通文本属于自然场景文本中的一种,与一般的场景文本检测不同,交通文本不仅具有自然场景文本多样性和可变性、背景复杂和遮挡以及较差的成像质量等特点,还具有交通标识文本本身的特点,分布稀疏,文本行呈现细长,文本布局混乱等特点,而交通文本检测与识别是当前智慧交通和自动驾驶中不可或缺的一环,所以对交通文本检测和识别的研究既充满着巨大的挑战也充满着巨大的前景,本文以交通文本为研究对象,从文本检测和文本识别两个方面进行研究: 1.针对交通文本分布稀疏,文本行呈现细长,文本布局混乱等特点,本文在EAST的基础上,设计了一种独特的文本区域标签,即将缩小的文本区域分为边界区域和中间区域,其中边界区域又分为头部像素区域和尾部像素区域,在预测结果中利用头部像素区域预测文本框左边或上边两个顶点的坐标,利用尾部像素区域预测文本框右边或下边两个顶点的坐标,这样巧妙地解决交通文本中长文本检测的难题,并且通过实验检验了该方法在公共的自然场景文本检测中的性能,也通过实验重点分析了该方法对交通文本检测的有效性。 2.针对输入文本识别模型中的文本通常处于不规则的形态,有可能是前面的文本检测算法性能不佳导致文本检测框不能紧密包围文本,或者是拍摄的相机的视角出现偏斜导致文本发生投影形变,或者是如今广泛存在的曲线文本,这些文本都是在图片上呈现二维分布,所以本文提出了在文本识别网络前面添加一个空间变换网络(STN)来矫正倾斜扭曲的文本,使文本在图片近似呈现一维分布,并通过具体的实验确定了空间变换的参数,也通过对比实验说明了添加矫正网络和不添加矫正网络对文本识别网络性能的差异。 3.在文本识别网络的训练过程中,鉴于文本识别的分类数目巨大,我们首先将提出的网络在数量丰富的SyntheticChineseStringDataset合成中文文本数据集进行了预训练,然后在现有交通文本检测数据集的基础上,自制了一个交通文本识别数据集,在自制的交通文本识别数据集上,刻意地通过随机旋转添加了一些扭曲因素,再将自己的模型在此数据集上进行微调,进一步增强本文的文本识别算法在扭曲的交通文本上的识别能力。 |
作者: | 屠君超 |
专业: | 电子与通信工程 |
导师: | 王章静 |
授予学位: | 硕士 |
授予学位单位: | 电子科技大学 |
学位年度: | 2021 |