论文题名: | 基于聚类算法的船舶航行规律挖掘研究 |
关键词: | 船舶航行规律;数据挖掘;聚类算法;深度表征学习;轨迹特征表示 |
摘要: | 随着经济的发展,航运业日渐昌盛,船舶数量持续上升,造成航道和港口承运压力增大。海事部门为保证船舶航行安全,研发了船舶自动识别系统(AutomaticIdentificationSystem,AIS)。AIS数据中包含了船舶航行信息,为挖掘船舶航行规律提供了数据基础。通过挖掘船舶航道和频繁活动区域等船舶航行规律,可以为海事部门对船舶航线规划和异常检测等工作提供技术支持。 为应对目前通过AIS数据挖掘船舶航道和频繁活动区域中存在的问题,本文进行了如下两方面的研究,主要内容如下: 1、针对目前轨迹聚类算法将轨迹特征表示和聚类分配任务分开进行导致聚类效果不佳,造成航道提取不准确的问题,提出了一种将轨迹特征表示和聚类分配任务同时进行的深度聚类方法来提取船舶航道。首先,预处理船舶轨迹数据;然后,利用船舶轨迹数据训练自编码器,通过编码器部分提取船舶轨迹初始特征;接着,将自定义聚类层与编码器部分结合构建深度聚类网络,实现轨迹特征表示和聚类分配任务同时进行,完成对船舶轨迹的聚类分析;最后,使用轨迹簇中典型轨迹代表船舶航道。 2、针对目前频繁活动区域提取需人为设置密度阈值且仅考虑轨迹数据空间信息,导致频繁活动区域提取不准确的问题,提出了一种考虑时间和空间信息的网格密度峰值聚类方法来提取船舶频繁活动区域。首先,确定时空粒度,在网格密度峰值聚类方法中将箱型图和手肘法结合实现类簇中心网格自动选取;然后,根据各类簇中网格局部密度分布实现密度阈值自动选取,获取单一时空粒度船舶频繁活动区域;最后,通过时空融合,获得多时空粒度船舶频繁活动区域。 在特定海域内实验,基于深度表征学习的聚类和基于密度的噪声应用空间聚类分别提取出0条和9条航道,而本文方法提取出17条航道,提取效果更好;传统网格聚类方法仅能提取单一时空粒度频繁活动区域,而本文方法能够提取多时空粒度频繁活动区域,提取的频繁活动区域能更准确地体现船舶活动情况。 |
作者: | 张帆 |
专业: | 信息与通信工程 |
导师: | 熊炫睿 |
授予学位: | 硕士 |
授予学位单位: | 重庆邮电大学 |
学位年度: | 2022 |