摘要: |
随着人们日常生活水平的提高,人们持着手机、数码相机拍摄自然场景中的文字图像,它们即可自动把图像中的文字转换成可编辑的文本资料。自然场景中的文字识别(OCR)已经成为人们日常生活中的一种迫切需求。对于复杂自然场景,文本区域定位已成为OCR必不可少的前提环节。本文结合科研项目,重点对文字的颜色信息和形状信息进行了深入的探讨,提出了一些实效的文本定位算法:(1)基于RGB阈值化聚类的文本区域定位算法。该算法首先对彩色图像的RGB分量分别进行局部阈值化,然后通过颜色聚类形成若干层子图像,再在各子图像中进行刷子刷图、连通域分析等处理,最后把各子图像综合。(2)基于人眼感知HSV空间聚类法。利用HSV空间模型,根据人眼对颜色的感知原理把自然图像分为红橙黄绿青蓝紫七彩色子图和纯黑白的子图,然后再进行后期处理。在改进的颜色子图中把图像分割成了人们常用的红黄绿蓝灰色图像。(3)基于HSV与Sober边缘检测混合模型的文本定位算法。该算法既考虑文字的颜色信息,又考虑文字的形状边缘信息,充分利用HSV图像聚类和Sober边缘检测的优点,把两者结合起来形成混合模型,从而达到更高识别率的结果。
实验结果表明,本文所提出的几种文本定位算法具有新颖之处,这些方法不但可以相对准确有效地定位出相应的文本区域,而且能够比较准确的框定文本区域的大致结构,具有一定的理论价值和较高的实用价值。
另外,文章介绍了图像处理中的一些实用算法。对桥梁视频裂缝检测与监控进行了深入的研究;同时,对基于图像处理的仪表识别系统的组成以及识别过程也进行了详细的介绍。
|