论文题名: | 基于数据挖掘的船舶航行轨迹异常检测方法研究 |
关键词: | 船舶轨迹;异常检测;数据挖掘;多特征聚类;相似性度量;高斯混合模型 |
摘要: | 随着内河航运的飞速发展,内河船舶航行安全成为亟需解决的问题。全国每年各内河水域均有船舶碰撞、搁浅等水上交通事故发生,导致巨额的经济损失和大量的人员伤亡。而船舶航行轨迹异常检测,能有效发现水域中那些偏离正常航行轨迹的船舶,从而提高船舶航行安全性,减少事故发生。本文针对内河航道特点,依据历史AIS数据建立船舶航行正常轨迹模型,利用数据挖掘技术实现对船舶异常轨迹的检测。具体研究内容及创新如下: 1)研究了多特征距离的轨迹相似性度量方法,建立了船舶正常轨迹 从船舶子轨迹的位置、航向、航速三个方面考虑计算各自距离,并进行加权求和,形成船舶轨迹多特征距离,以便更准确衡量船舶子轨迹间的相似性。并在此基础上,设计了多特征快速聚类算法对子轨迹聚类,得到船舶正常轨迹数据。 2)提出了基于多特征聚类的船舶轨迹异常检测方法 通过船舶正常轨迹数据,构建船舶正常轨迹采样点模型。在船舶轨迹异常检测时,从两个方面考虑内河航道特征:(1)考虑内河航道的宽度,构建了位置异常检测模型,通过求取采样点的中位数,减少了航道宽度对异常检测的影响。(2)针对内河航道特点,综合考虑航向与航速,构建了航向与航速异常检测模型,从而能更好的符合航道上水道(航向角大)航速慢,下水道(航向角小)航速快的特征。最后,利用青山夹水道AIS数据,实验验证了此异常检测方法的可行性及有效性。 3)研究单网格内GMM(高斯混合模型)的K值及去噪方法,设计了IMCFSFDP算法 在CFSFDP算法[37]的基础上,提出其改进算法IMCFSFDP:(1)针对CFSFDP算法聚类中心选取依赖于决策图的不足,设计了附加函数?来自动确定聚类中心,从而有效获取了GMM模型的K值;(2)针对网格内船舶轨迹点数据的特征,本文采用已有改进的局部密度计算公式,减少了局部密度冲突(局部密度相同)的概率;采用已有改进的最小高密度距离计算公式,避免了类簇中出现多个聚类中心;设计了附加函数?,解决了CFSFDP算法由于类簇间差异太大(航向相反)而无法有效去噪的问题。 4)提出了基于改进GMM的船舶轨迹异常检测方法 在研究内容(3)的基础上,对每个网格构建了船舶正常轨迹点的高斯混合模型。在异常检测时,设计了基于点的船舶轨迹异常检测算法,通过计算轨迹点异常率进行船舶轨迹异常检测。最后,利用青山夹水道AIS数据,实验验证了基于改进GMM的异常检测方法有效性及可行性。 |
作者: | 邓磊 |
专业: | 计算机科学与技术 |
导师: | 高曙 |
授予学位: | 硕士 |
授予学位单位: | 武汉理工大学 |
学位年度: | 2016 |
正文语种: | 中文 |