论文题名: | 基于可变形部件模型以及稀疏特征的行人检测 |
关键词: | 稀疏特征;语义模型;行人检测;计算机视觉;智能交通 |
摘要: | 人体检测是计算机视觉领域的研究热点与难点,在智能监控、智能家居服务型机器人、汽车安全驾驶、机器人视觉导航、智能交通、游戏娱乐等方面都有广泛的应用。人体检测不仅有直接的应用价值,同时也是计算机实现人体动作行为识别和跟踪等视觉技术的基础,具有很好的理论研究价值。 本文重点在研究目标检测模型以及描述图像特征算子。使用语义的形式定义人体检测模型,在这种形式上,从简单的刚性模型到复杂的可变性部件模型都可以通过不同的组合规则来描述。本文就是沿着这个思想进行探索,逐步丰富行人目标检测模型。通过构建并训练复杂的模型结构来提升行人检测的性能,并在PASCAL VOC挑战赛数据集合中来验证该模型。 在构建更丰富模型的同时,本文利用现有的训练数据,这些训练数据通常指定了标签,如对象的边框,但相比语义结构模型来说,这些标签没有标明各个部件,是一种“弱”标签,本文引入一种具有判别能力的弱标签学习方法,来对该弱标签数据集合进行训练,与传统的训练方法相比,性能上有很大提升。 针对HOG特征的局限性,本文提出一种基于稀疏表达的特征描述算子,采用K-SVD稀疏学习得到图像的稀疏编码,统计稀疏编码直方图作为图像特征,该特征算子更具表现力以及一般性。 为了将研究应用到实际的应用当中,行人目标检测不仅要求准确率高,而且速度快。针对这个问题,本文采用级联检测框架。通过选择级联阈值的方法,将检测速率提高了4倍以上。 |
作者: | 许仕哲 |
专业: | 电子与通信工程 |
导师: | 刘小平;余峰 |
授予学位: | 硕士 |
授予学位单位: | 南昌大学 |
学位年度: | 2015 |
正文语种: | 中文 |