论文题名: | 基于大数据的动车组维修成本关键技术的研究 |
关键词: | 动车组;大数据;维修成本;关联规则 |
摘要: | 近些年来,高速铁路飞速发展,大部分车辆进入了检修保养的周期,如何降低动车组的维修成本越来越成为人们的研究重点。本论文通过挖掘动车组的维修成本数据和运行数据之间的关联关系,来找出动车组关键部件维修成本的高低与动车组的运行数据的深层联系,为制定以后维修策略和降低维修成本提供参考。 随着动车组的运行和维修数据不断积累,传统的单机算法根本无法处理动车组的海量数据,为此本论文引入了Hadoop计算机集群框架,以分布式的方法来处理动车组庞大的运行和维修数据。传统的关联规则算法只能支持单一支持度的设定,然而数据库中的每个属性都有不同重要性,单一的支持度无法满足具体应用的需求,为此,本论文使用了基于多支持度的加权关联规则算法——AMWARMS(algorithm of mining weighted association rules based on multiple supports)算法。本文进一步对该算法的多支持度进行了改进,并优化了算法的运行效率,使该算法能够更好地适应动车组海量数据的需求。本论文的主要内容包括: (1)对动车组的维修成本进行了深入研究,通过对动车组关键部件维修过程的分析和调研,整理了动车组关键部件维修成本包含的内容。 (2)针对动车组数据的实际需求,对多支持度的关联规则挖掘算法——AMWARMS算法进行了改进,首先使用概念格等价类的理论改进了算法的多支持度问题,然后利用Tidset垂直数据格式优化算法的运行效率,最后基于Hadoop实现了算法的并行化,使算法能处理海量数据。 (3)经过实验验证,在不同的支持度、不同的节点数量或不同的数据量下,改进后的算法比原算法的运行效率有明显提高。通过改进后MRAMWARMST算法挖掘动车组的运行和维修数据之间的关联关系,并将结果进行可视化展示。 |
作者: | 孙海舰 |
专业: | 计算机技术 |
导师: | 张春 |
授予学位: | 硕士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2016 |
正文语种: | 中文 |