论文题名: | 基于Hadoop的动车组故障诊断关键技术的研究与实现 |
关键词: | 动车组;故障诊断;分布式框架;C4.5分类算法;Hadoop平台 |
摘要: | 随着我国高速铁路近年来的不断发展,动车组已经开始大规模投入使用,现阶段已经积累了海量的动车组运行状况数据并以TB数量级增长。如何利用海量的动车组故障数据进行分析,并进一步指导动车组维修和保养工作,这对于动车组故障诊断具有重大意义。然而高速铁路动车组运行状况数据具有多样化、容量大、复杂度高、速度快等特点,传统的数据挖掘算法效率低下,实时性差,已经无法满足目前对于动车组关键部件故障诊断应用的需求。因此本文提出引入Hadoop分布式计算框架,该框架的Map/Reduce编程模型能够根据动车组数据的特点有针对性地解决现阶段动车组故障诊断中的存在的不足,因此有一定的理论和现实意义。 本文提出了基于Hadoop分布式框架的动车组故障诊断大数据解决方案,并通过对基于Hadoop的C4.5分类算法的优化为提高动车组故障诊断的效率提供了有效方法,并在实际应用中得到了验证。 本论文的工作有以下几方面: (1)在分析了MapReduce分布式计算框架、分布式文件系统HDFS、数据仓库Hive等Hadoop核心技术的基础上,给出了基于Hadoop的动车组故障分析大数据解决方案,搭建了Hadoop集群环境。 (2)在算法选择上分析了原始C4.5算法在基于Hadoop平台动车组故障诊断中存在的不足,提出了两种改进算法并分别在准确性及可扩展性方面对原始C4.5算法进行了性能改进,集群的负载均衡能力得到提高。 (3)将改进后的算法应用于本实验室的动车组故障真实数据场景下,并产生了相关的实验对比结果。实验表明,改进算法比原始C4.5算法在稳定性及可扩展性上有了明显提高,可满足大数据背景下动车组故障诊断的相关需求。 论文所设计的动车组故障诊断方案满足了特定的要求,具有较好的并发挖掘性能,提高了动车组故障诊断分析的效率。 |
作者: | 张博洋 |
专业: | 软件工程 |
导师: | 刘峰 |
授予学位: | 硕士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2016 |
正文语种: | 中文 |