论文题名: | 基于数据挖掘的船舶碰撞事故分析研究 |
关键词: | 船舶碰撞事故;数据挖掘;分类预测;聚类分析 |
摘要: | 船舶碰撞事故是“人—船—环境—管理”等因素共同作用的结果,它呈现出多因素、高模糊性的特点。用数据挖掘方法对船舶碰撞事故进行分析已成为水上智能交通的研究热点。将船舶碰撞事故数据作为数据挖掘的对象进行分析研究,主要的困难在于:一方面,缺少可用于分析研究的船舶碰撞基础数据库;另一方面,事故数据存在离散性和多维度的特点,难以构建有效的分析和预测模型。本文在建立船舶碰撞基础数据库的基础上,通过综合使用特征提取、聚类、分类等数据挖掘方法,从船舶碰撞的因素分析和事故严重程度预测两方面进行了深入研究。主要研究工作如下: (1)研究了船舶碰撞数据的特点,建立了可供研究分析的船舶碰撞基础数据库。船舶碰撞事故研究往往以碰撞历史数据作为分析对象,而目前还没有一个公开、完善的可供研究使用的历史数据库。通过搜集和筛选出136篇水上船舶碰撞事故报告,运用数据库技术,对船舶碰撞数据进行提取、清洗和量化,经结构化设计后,为碰撞事故的分析研究提供数据支持。 (2)进行了基于卡方检验和聚类分析的船舶碰撞因素分析。将因素分析作为一个特征选择问题,将提取的18个碰撞事故影响因素与碰撞结果进行卡方检验,根据因素与碰撞结果间的相关性大小,对影响因素进行致因筛选,并将其分为主要因素和次要因素实现船舶碰撞事故的致因分析。为了挖掘事故主要因素与碰撞结果的特征关联模式,运用优化的K-Modes算法对主要因素进行了聚类分析,根据主要因素的特征分布表,挖掘出船舶碰撞的相关特征模式。 (3)引入数据挖掘的特征提取和分类的思想,针对现有预测模型的不足,构建了一种基于因子分析和支持向量机的船舶碰撞严重程度分析预测模型。使用因子分析方法对原始碰撞数据进行了特征提取,得到了10个公共因子,通过对公共因子的解读和分析,挖掘出船舶碰撞事故的隐含因素并得到影响因素的重要程度的排序。最后结合遗传算法优化的支持向量机模型实现了对船舶碰撞严重程度的二分类和四分类预测。与当前流行的逻辑回归、神经网络等预测模型相比,该模型具有更高的分类准确率。与卡方检验构建的预测模型相比,两模型具有相似的结果,印证了这两种模型方法的有效性。 |
作者: | 方辉 |
专业: | 电子科学与技术 |
导师: | 郭志强 |
授予学位: | 硕士 |
授予学位单位: | 武汉理工大学 |
学位年度: | 2017 |
正文语种: | 中文 |