论文题名: | Hadoop平台下的分布式SVM算法及其应用研究 |
关键词: | 高速列车;振动监测;故障诊断;机器学习;支持向量机;分布式计算 |
摘要: | 随着高速列车的快速发展,高速列车安全性问题逐渐引起人们的重视。高速列车振动监测数据为分析列车服役性能提供了条件。然而,如何及时准确地从这些海量数据中挖掘故障特性进行故障诊断,是目前存在的难题。 与此同时,这几年来互联网技术迅猛发展,不断涌现大规模数据信息,如何处理和利用如此大规模的信息,成为人们研究的热点。支持向量机是一种高效的监督式的机器学习方法,被广泛应用于分类识别以及回归分析等领域。但是传统的SVM在面对大规模数据时,因其时间复杂度较高和算法占用的内存庞大,导致训练效率特别慢为了解决这两大难题,本文根据CascadeSVM算法对训练模型进行适当的调整与优化。并将其应用于高速列车故障诊断中,对故障进行分类和定位。 首先本文深入的探讨SVM算法的并行化。根据CascadeSVM算法,改进新的训练模型,并通过模拟实验,对比传统SVM、分组SVM、CascadeSVM,考虑识别准确率和训练效率两大衡量标准,证明该分布式SVM算法两者兼备,在处理大数据时能够取得良好的结果。 然后将分布式SVM算法与Hadoop平台结合,构建了并行化分布式SVM算法。并选取标准MNIST数据集进行实验,实验结果显示数字总体识别率达到98%,加速比提高到3,从而说明该算法算法在识别结果准确率、并行化效率方面具有良好表现。 最后分析高速列车正常和故障振动数据时的时域、频域特征。采用EEMD算法提取IMFs特征,运用分布式SVM算法对高速列车振动数据进行深层特征提取并进行故障分类。实验结果表明,通过对较好通道的统计结果来看,列车故障辨识的识别率为96%,故障定位识别率为89%,且算法效率有一些提升。 |
作者: | 熊定鸿 |
专业: | 控制科学与工程 |
导师: | 金炜东 |
授予学位: | 硕士 |
授予学位单位: | 西南交通大学 |
学位年度: | 2016 |
正文语种: | 中文 |