当前位置: 首页> 学位论文 >详情
原文传递 面向渔船安全的人体检测与跟踪算法研究
论文题名: 面向渔船安全的人体检测与跟踪算法研究
关键词: 渔船安全;人体检测;跟踪算法;轮廓提取;目标分类
摘要: 人体检测与跟踪是安全视频监控中的核心技术,是实现计算机视觉的基础,也是该领域中的研究热点,同时涉及图像处理、模式识别、自动化控制、计算机图形学、机器学习和人工智能等多个学科,是一个多学科交叉且极具挑战性的研究课题。人体检测与跟踪在机器人视觉、安全监控、辅助驾驶和高级人机交互等方面的应用具备潜在经济价值,发展前景广阔。
  几十年来国内外学者们已经采用各种各样的方法展开了深入的研究,人体检测与目标跟踪技术取得了一定的进步,也验证了基于视觉分析的方法能够成功模仿人来执行一些特定的功能。但是,由于人体姿态复杂、衣着以及外观的多样性,在复杂的场景下还要受到视角、遮挡的挑战,人体检测与目标跟踪变得异常艰难,目前尚未没有成熟的算法能够同时满足对场景的通用性强、检测准确性高、算法效率高、实时性强的要求。渔船驾驶舱场景正是这种复杂场景的典型,空间狭小,光线多变,人体姿态多样。本文针对该场景下的人体检测与跟踪技术展开了深入的研究,搭建渔船安全监控系统实时检测,为渔船的出海安全作业提供预警与帮助。
  本文工作的基本思路是将渔船驾驶舱场景下的人体检测划分为人体轮廓提取和人体目标分类。首先将渔船驾驶舱场景画面中的人体轮廓提取出来,分割出人体的轮廓区域,进而对该区域进行人体目标分类,判断该区域是否为存在人体目标、以及人体的数量和位置。目的在于避免大量背景进入人体目标分类阶段,节省了计算时间。然后,根据人体目标分类得到的多目标的位置进行跟踪,分析其运动轨迹,获取渔船驾驶舱中人员活动的数量和方向。
  在人体轮廓提取方面,本文通过对常用的几种区域提取方法进行研究和实验发现,运动检测是最常用的提取方法。单目固定摄像机场景下进行运动检测以背景减除法最佳,而且多以混合高斯模型为背景模型。然而,混合高斯模型主要用于行人或运动目标的检测,用于室外监控效果较好,对于检测运动缓慢、间歇停滞的目标,存在前景目标空洞问题。关键在于背景模型的更新,场景中光线的变化又为背景更新带来困难,本文提出了一种多模型协同前景目标提取方法来解决这些困难。该方法采用混合高斯模型学习背景,通过构建光线检测模型和场景状态检测模型,监测场景中光线变化情况和场景状态,协同控制背景模型的适时更新,这样既解决了前景空洞问题,又兼顾了检测效率。另外,阴影检测模型的加入使得人体轮廓的提取变得更加精确。利用加权投影的方法对目标进行分割,得到的人体区域经过筛选就可以进行下一步的人体目标分类了。
  在人体目标分类方面,本文采用了基于特征的机器学习的方法进行人体目标分类。由于渔船驾驶舱中摄像机的安装位置受到限制,场景画面只能是监控区域的俯视图像。场景中人体的下肢容易受到驾驶台的遮挡,只有头部体现的较为完整,因而本文采用了形变较小和姿态较为稳定且遮挡情况较少的头部特征,特征集方面选取了对人体的轮廓和边缘表达较好的梯度直方图 HOG(Histogram of Gradient)特征。采集俯视图像中人体头部图像为正样本,数量三千幅左右;负样本尽量泛化包含室内外场景和不含头部特征的肢体。这些样本经过尺寸归一后,提取其HOG特征使用支持向量机SVM算法(Support Vector Machine)训练得到离线的人体头部特征分类器。分类器要在检测率和检测精度两者之间找到平衡,在保证较高检测精度的同时有着较高的检测率。借助此分类器就可以对待检图像进行分类检测,检测方法采用固定窗口在待检图像金字塔上滑动扫描进行多尺度检测,并对检测过程中同一目标被多次检测进行融合,最终实现人体目标的分类,记录人体头部窗口出现数量及位置,用于下一步的目标跟踪。
  在多目标跟踪方面,本文对单目固定摄像机下的多目标跟踪方法进行了相关的研究,采用了基于扩展的Mean shift的多目标在线跟踪算法。该算法能够根据运动区域进行多目标的在线跟踪。同时,Mean shift算法对目标在运动过程中产生的大小和形态的变化具有良好的适应性。通过在已知数据集合上和渔船采样视频进行测试,本文的面向渔船安全的人体检测与跟踪算法取得了良好的检测效果,同时能够满足在线视频检测的实时性。
  尽管本文在面向渔船安全的人体检测与跟踪算法做出了一些研究成果,但也清醒的看到许多不足之处:渔船驾驶舱空间狭小极容易造成的遮挡问题;多目标情况下分类器效果不佳;跟踪后运动轨迹对人行为进行分析理解,从而更好的帮助渔船处理危机保障安全。这都是亟待进一步研究解决的问题,希望本文的研究工作为同领域研究者带来启发。
作者: 冀续烨
专业: 计算机科学与技术
导师: 陈明
授予学位: 硕士
授予学位单位: 上海海洋大学
学位年度: 2015
正文语种: 中文
检索历史
应用推荐