论文题名: | 高速铁路动车组故障关联关系分析的研究 |
关键词: | 动车组;故障信息;数据挖掘;关联规则;维修策略 |
摘要: | 我国高速铁路发展迅速。作为快捷的交通工具,高速动车组得到了广泛的运用,其安全运行和维修工作变得越来越重要。我国借助先进的数据采集设备和计算机存储技术,随着时间的推移,产生和积累了大量的高速动车组故障信息数据。如何从这些海量数据中提取出有效的信息和知识,以指导动车组的维修工作,保障动车组的安全运行,是一个亟待解决的问题。 数据挖掘可以从实际的应用数据中,挖掘出隐藏在其中的具有重要应用价值的信息,即可以将数据转化为有用的知识。作为数据挖掘的主要方法,关联规则挖掘可以发现数据事务中项之间的相关性。如何利用高效的关联规则挖掘算法从海量动车组故障信息数据中挖掘出动车组的故障关联关系,以辅助制定维修策略,提高动车组的安全可靠性,是本论文的研究重点。 本论文的主要工作和创新之处包括以下几部分: (1)分析了目前国内外动车组和数据挖掘的研究现状,梳理了动车组维修相关理论和数据挖掘相关知识理论,并重点研究总结了Apriori、FP-Growth和Eclat三种关联规则算法; (2)梳理了动车组故障信息数据的种类,分析了动车组数据存在的问题,给出了数据清洗、数据转换等数据预处理方案; (3)提出了基于加权思想的FP-Growth关联挖掘算法,称为WFPAM(Weighted FP-Growth Association Mining)算法,通过设置权值来表示动车组故障数据中不同项目的重要程度;为了提高算法的执行效率和性能,采用深度优先搜索方法对FP-tree进行先根遍历,避免了挖掘FP-tree产生条件模式基时多次回溯的问题,阐述了改进算法的思想;然后基于MapReduce编程模型对算法进行了并行化改进,以适用于动车组海量数据的挖掘,最终提出了MR-WFPAM算法,并设计了算法的实现过程; (4)使用FP-Growth、WFPAM、MR-WFPAM三种算法进行了动车组故障数据关联关系挖掘实验,比较三种算法的性能,验证了对算法改进的有效性和优越性,最后将挖掘出的动车组故障关联规则进行分析和可视化展示。 |
作者: | 郭玉霞 |
专业: | 计算机科学与技术 |
导师: | 张春 |
授予学位: | 硕士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2018 |
正文语种: | 中文 |