论文题名: | 面向动车组运维的多源数据预处理关键技术研究与实现 |
关键词: | 高速动车组;运维管理;多源数据;预处理 |
摘要: | 随着我国高速铁路网络的不断延伸,动车组质量和运维效率的关注度也在不断提高。为了更全面而准确的进行分析,就需要结合多个数据源的信息,从不同的业务系统中获取更全面更丰富的有关动车组运维的数据,用来支撑复杂的分析。然而由于多源数据中有着数据量大、异构、多维、多尺度、不同步、不完整等问题,所以在分析这些多源数据前,如何对多源数据进行预处理成为一个难题。因此,本文针对面向高速铁路动车组运维分析中,多源数据中存在的各种问题,研究多源数据预处理的相关技术与动车组运维分析相结合的方案。提出一套完整的面向动车组运维的多源数据预处理体系,将分布在不同数据源的数据处理成格式统一,清晰,完整,意义明确的数据,从而为动车组运维的相关研究和分析打下坚实的基础。 本论文的主要工作包括以下三点: (1)研究数据预处理的相关理论和方法,包括常规数据预处理和多源数据预处理两种情景,总结出多源数据预处理中的主要任务。基于此,深入研究和分析动车组运维分析中多源数据的情况以及多源数据预处理存在的问题。 (2)针对动车组运维的多源数据预处理中存在的问题提出具体的解决方案,并提出一套完整的面向动车组运维的多源数据预处理体系。对于其中难以处理的不同步、不完整问题提出FCSPM(Fast Convergence Sequence Pattern Mining)算法进行解决。通过实验对比,证明该算法取得了比其他相似算法更好的处理效果。 (3)最后根据现有动车组车地信息系统现状,在不改动现有信息系统的情况下,实现了基于Kafka的车载监测数据在线预处理功能,取得了良好的效果。 |
作者: | 黄天立 |
专业: | 计算机科学与技术 |
导师: | 张春 |
授予学位: | 硕士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2018 |
正文语种: | 中文 |