当前位置: 首页> 学位论文 >详情
原文传递 基于文本挖掘的高铁车载设备故障诊断方法研究
论文题名: 基于文本挖掘的高铁车载设备故障诊断方法研究
关键词: 车载设备;故障诊断;故障特征;文本挖掘;专家系统;高速铁路
摘要: 高速铁路信号系统车载设备是列控系统的核心设备之一,是保证高铁安全运营和影响铁路运输效率的关键因素。然而车载设备发生故障的概率仍然相对较高,而且目前车载设备的故障诊断技术和维护手段仍然依据专家经验,已不能满足我国铁路维护的迫切需求。因而开展关于高速铁路车载设备故障诊断方法的研究具有重要意义。
  高铁运营以来,每年都有大量的维修记录产生。这些记录为知识的挖掘提供了必要的数据基础,而挖掘的知识将有助于提高故障诊断的效率以及为以后相似的故障案例的处理提供指导,同时也能为专家系统的构建提供必要的知识基础。在维护记录数据中,我们可以采用文本挖掘技术来建立故障特征和故障模式之间的联系。正是这种联系能够为故障诊断提供了有力支持。然而,基于高铁维护记录数据的知识自动挖掘任务是个极具挑战的过程,主要包括以下原因:
  (1)高铁维护记录数据的高维性。在维护记录中,包含着数万个词项特征。在去除停用词和噪声后,特征集合依然十分庞大,这对于后续的故障诊断算法构成了极大挑战。因此高效的特征选择方法是提高故障诊断可靠性的一个关键环节。
  (2)高铁维护数据的故障模式分布不均衡问题。在维护记录中,一些故障模式的样本数量远远多于其他故障模式的样本数量,这是由车载设备构成的复杂性和工作环境的多样性所决定。不均衡的类别分布对均衡数据下提出的并以高准确率为目标的分类学习算法构成了极大的挑战。
  (3)语义故障特征的缺失。由于传统的特征提取方法以“词袋模型”为基础,未考虑词项故障特征之间的内在联系,存在严重语义故障信息(如故障现象)丢失。同时,由于缺乏车载设备领域先验知识的考虑,模型提取的语义故障特征不理想。
  本文针对诊断过程中存在的上述缺陷,以高铁车载设备的维护数据为依据,首先提出一种融合语义特征的两级故障特征提取方法;在此基础上,针对高铁设备故障诊断的复杂性,采用基于支持向量机(SVM)的分类器和分级策略对车载设备两级故障模式进行故障诊断。试验表明,提出的模型能够较大程度的提高车载设备,尤其是“STM相关故障”等小类故障模式的故障诊断效率及可靠性,能够为维护人员采取必要的维护和预防措施提供有力支持。
  论文的创新性工作如下:
  (1)提出了一种改进x2统计(CHI)的高铁车载设备的词项级故障特征选择方法。通过对高铁维护数据的故障模式分布不均衡性进行深入分析,提出了一种改进CHI的词项级故障特征提取方法。通过对各故障模式专有故障特征权重的调整,以均衡故障特征的重要性。对于公共故障特征,我们以故障模式的分布距离为衡量指标,对公共故障特征作进一步的选择,以得到最优的故障特征。
  (2)提出了一种先验Latent Dirichlet Allocation(LDA)模型进行车载设备的语义级故障特征提取。为了提取更有意义的语义级故障特征,首先提出了先验知识的提取方法,然后将先验知识整合到LDA模型来实现语义级故障特征提取。整合先验知识的LDA模型是一种半监督模型,它在一定程度上克服LDA模型作为无监督聚类模型在主题特征挖掘过程中存在的盲目性。最后,通过融合策略将两级故障特征进行融合,此模型能够生成较完备的故障特征空间,为后续故障诊断打下坚实的基础。
  (3)提出了一种分级车载设备故障诊断策略。将一级故障模式诊断结果作为新的特征融合到二级故障模式诊断的特征空间,提高了二级故障诊断的准确率。
作者: 王峰
专业: 交通信息工程及控制
导师: 徐田华
授予学位: 硕士
授予学位单位: 北京交通大学
学位年度: 2016
正文语种: 中文
检索历史
应用推荐