当前位置: 首页> 学位论文 >详情
原文传递 动车组故障数据挖掘的关键技术研究
论文题名: 动车组故障数据挖掘的关键技术研究
关键词: 动车组;数据挖掘;故障检测;主动维护
摘要: 目前,我国已掌握了包括牵引技术、制动技术、转向架技术等在内的高速列车核心技术,也已借助先进的传感器技术、数据采集设备和计算机存储设备积累了海量的高速列车故障数据。这些数据以TB数量级增长,传统的数据挖掘解决方案已经无法胜任这种急速增长数据集的分析任务。云计算的出现,因其强大的计算能力和海量的存储能力等特点,已经成为数据挖掘领域重要的研究方向。Hadoop是一个相对成熟的开源云计算框架,具有高可靠性、可伸缩、分布式等特点,用户使用简单的编程模型就可以在计算机集群上对大规模数据做分布式计算。如今,Hadoop已经被各领域广泛地使用在大数据处理的场景之中。本论文根据Hadoop分布式的特点,以经典的Apriori数据挖掘算法为例,设计并实现了一套基于Hadoop的数据挖掘方案,并对该方案的进行了详细的阐述。
  本文的具体内容包括:(1)分析了Hadoop的核心技术及其运行原理,分布式计算框架MapReduce和分布式文件系统HDFS。(2)提出了基于Hadoop的数据挖掘系统的基本架构,阐述该系统的各个模块功能。(3)在Hadoop平台上,对Apriori算法的实现了并行化改进,在Hadoop平台的MapReduce编程模型上给出改进算法的执行流程。(4)分析采集到的动车组复杂装备海量数据,通过挖掘结果分析动车组故障发生时的各种条件极其关联度。(5)利用动车组故障数据集,在Hadoop平台上对改进后的算法进行单机测试和集群测试,从算法的效率及扩展性方面进行了对比分析。实验结果表明,改进后的算法具有较高的执行效率,良好的加速比和可移植性,论文设计的数据挖掘系统满足了特定的要求,实现了大数据规模下的数据挖掘。
  本文的研究为数据挖掘算法的不断完善与改进提供了参考,并对动车组的主动维护技术、提高安全性和运行效率、降低维护成本提供了重要而实用的理论价值和经济价值。
作者: 侯萌华
专业: 计算机技术
导师: 张杰
授予学位: 硕士
授予学位单位: 北京交通大学
学位年度: 2014
正文语种: 中文
检索历史
应用推荐