论文题名: | 铁路编组站数据挖掘及应用研究 |
关键词: | 铁路编组站;数据挖掘;风险预警;Apriori算法;软件设计 |
摘要: | 铁路编组站是铁路网上集中办理货物列车到达、解体、编组出发、直通和其它列车作业,并为此设有比较完善的调车作业的车站。随着计算机技术的发展,铁路运输管理信息系统(Transportation Management Information System简称TMIS)的实现,业务数据量日趋庞大,在这些海量数据中隐藏着有价值的关系和规则,分析这些数据也不再是单纯为了研究的需要,更主要的是给铁路相关管理部门提供智能辅助决策信息,来为铁路营销和安全运输服务。本文将数据挖掘技术引入到铁路编组站中的客户细分和安全风险预警系统中,主要研究工作如下: (1)提出了一种改进的K-means算法。针对传统的基于距离识别孤立点的K-means算法中无法处理密度不均匀的数据集局部特征的缺点进行了改进,提出了使用距离均和识别孤立点,并引入方差对孤立点进行判断处理。通过实验验证,改进后的K-means算法有效避免了将孤立点全部抛弃的盲目性,有效降低了总体平方误差,把相同特质的数据划为一个簇内,提高了聚类的精确度。将改进后的K-means算法,应用到铁路客户细分领域,使得聚类结果更为精确,从多维的角度较为全面、深入地细分客户消费行为特征。 (2)对 Apriori算法进行优化,通过降低扫描数据库的次数和减少候选集数目,提高算法效率。本文将优化后的Apriori算法应用到铁路编组站安全风险预警系统中。通过对违章发牌历史数据的挖掘,找出车间、岗位、班次等数据项之间关联性规则,总结现场职工违章行为的规律性,为铁路安全运输管理部门制定正确的预防和管理决策提供科学的依据。 |
作者: | 邓程 |
专业: | 计算机技术 |
导师: | 朱艳辉 |
授予学位: | 硕士 |
授予学位单位: | 湖南工业大学 |
学位年度: | 2013 |
正文语种: | 中文 |