摘要: |
电气化铁道在我国已取得了长足的进步。到2005年,电气化铁道已突破两万公里。电气化铁路正在向高速、重载的方向发展。为保证铁路运输的安全可靠供电,对铁路牵引供电监控系统(SCADA)的要求也越来越高。牵引供电SCADA系统调度中心保存了大量的实时数据和历史数据,目前铁路牵引供电SCADA系统产生的数据一般应用于统计报表、事故故障记录和曲线绘制等,是一种典型的联机事务处理。其对故障的分析处理能力较差。对于规模大、设备多、事故较多的牵引供电系统,需要一个能够根据SCADA系统中的大量信息,进行故障元件分析诊断、事故后数据分析、保护开关动作评价等功能完善的故障信息综合分析系统,以达到加快事故处理和分析目的是迫切需要的。
本文旨在SCADA系统现有功能的基础之上扩展其功能,利用数据仓库和数据挖掘技术改善SCADA系统的分析决策能力。文章首先分析了目前牵引SCADA系统的不足,指出大量的数据没有得到充分利用而过于浪费,提出了利用数据仓库和数据挖掘技术改善其决策分析处理的能力,提高SCADA系统综合性能。
接着,文中给出了数据仓库和数据挖掘技术在电气化铁道SCADA中应用的总体方案设计。采用了事件驱动和定时驱动相结合进行数据仓库的数据更新策略;采用了聚类算法中的模糊C-均值算法进行连续数据的离散化并模糊化处理;对不同源的数据进行了数据处理(抽取、清洗、转换);并基于关联规则等数据挖掘算法,给出了数据挖掘评估模型。
然后,文章采用了星形模型和雪花模型相结合的方法,给出了电气化铁路SCADA系统调度中心数据仓库详细设计,构造了牵引供电SCADA系统数据仓库体系结构。具体完成了牵引供电SCADA系统事实表和维表设计。并基于MSSQLServer2000DTS服务完成了SCADA系统数据仓库建立及更新。
其后,文章分析了关联规则Apriori算法在SCADA系统中应用的局限性,提出了相应的改进方案。并根据牵引供电SCADA系统特点,提出了从数据仓库记录分类、时间序列模式、分层模式三方面进行Apriori算法优化的策略,优化了Apriori数据挖掘算法,提高了挖掘效率。
最后,总结了本文的工作,对系统的优缺点进行分析,指出了下一步应该完成的工作。
|