论文题名: | 基于多模板匹配的行人检测算法研究 |
关键词: | 行人检测;多模板匹配;聚类算法;级联训练;智能视频监控;机器学习 |
摘要: | 行人检测是指检测图像或视频中是否存在行人并给出相应的位置信息,是计算机视觉的重要研究方向之一,其在汽车辅助驾驶系统、军事侦查、视频智能监控等诸多领域具有广泛的应用前景。近年来,人们提出了许多更为准确、高效的行人检测算法,大都将行人检测转化为二分类问题,并采用机器学习的方法训练分类器生成模板,对待检测图像进行多尺度滑窗搜索。在该类方法中,特征求取和分类器的训练是决定其检测准确率的两个关键因素。 本文针对行人外观姿态多样、背景复杂的难点,从分类器的训练过程出发,以线性支持向量机(Support Vector Machine,SVM)作为分类器,提出两种自适应学习多个模板的行人检测算法,使得多个模板更好的适应不同外观的行人,进而提高行人的检测准确率。主要研究成果概括如下: 第一,提出了基于聚类的多模板匹配行人检测算法。算法考虑选取对颜色和光照变化不敏感的特征描述目标(本文选取了梯度方向直方图( Histogram of Oriented Gradient,HOG)特征),首先采用聚类算法对训练正样本进行聚类,将具有相似外观(例如姿态和视角)的行人样本聚成一类,再分别对每一类样本独立训练生成模板,使得每个模板仅针对一类行人目标,以提高模板对该类目标的适应性;其次,在检测阶段,每个模板独立并行检测测试图像;最后通过线性加权的方式合并不同模板的重复检测结果。在INRIA和ETH行人数据库上对算法进行测试,通过不同聚类方法(基于内平方距离的层次聚类算法、K-Mea ns算法和FCM算法)和不同聚类数目(2类、3类和4类)的仿真实验,并对比了HOG算法,结果表明,该算法可以更好的适应行人外观的变化,在一定程度上降低检测结果的平均丢失率,获得更高的检测准确率。 第二,提出了基于级联训练的多模板匹配行人检测算法。在训练阶段,采用分类器级联的训练方式,针对前一级训练样本中的易错样本自适应选择新特征训练生成多个模板。算法定义选取的新特征为互补特征,由本文提出的互补特征选择策略(Complementary Features Selection Strategy,CFSS)从候选特征集中选取,最终选取了RGB和 LUV通道下的 HOG特征,细胞结构的局部二值模式(Local Binary Patterns,LBP)特征。在检测阶段,每个模板独立并行检测测试图像,最后通过线性加权的方式融合不同模板的重复检测结果。在IN RI A行人数据库上对算法进行测试,并对比了 VJ、HOG、HogLbp和 MultiFtr四种经典的行人检测算法,结果表明,算法采用的级联训练策略、CFSS策略可以有效融合不同特征,提高模板对行人外观变化的适应性,获得更高的检测准确率。 |
作者: | 洪传文 |
专业: | 电子科学与技术 |
导师: | 李洁 |
授予学位: | 硕士 |
授予学位单位: | 西安电子科技大学 |
学位年度: | 2014 |
正文语种: | 中文 |