摘要: |
我国铁路信息系统经过多年的建设已经具备了较为完善的业务及其支撑系统,并积累了海量业务数据。但是,这些数据分散在多个独立系统中,形成众多“信息孤岛”,信息分散、无法共享,数据完整性、一致性得不到很好的保证,数据应用水平不高,难以为决策者提供综合、高效、准确的信息。为解决上述问题,促进铁路跨越式发展,需要运用数据仓库技术将这些数据进行有效地整合、提炼、加工处理和发现信息,以更好的支持决策分析并最终为各级决策管理者提供及时、准确、科学的辅助决策依据。
本文概要介绍了数据资源整合技术的国内外发展概况,数据仓库理论知识及相关技术,作为后面各章节对数据仓库理论深入研究以及实际应用中合理构建数据仓库的基础。
重点研究了数据仓库的模型。在详细分析了铁路数据资源特点及共享需求的基础上,探讨针对铁路数据资源特点的数据仓库设计思想,提出了按三级模式构建铁路数据仓库架构,并对铁路系统进行了详细的主题划分及主题功能界定;同时解决了传统数据仓库无法完成的低粒度数据查询问题及跨主题数据重组问题;最后基于通用数据模型分析构建数据仓库逻辑模型。
本文针对货运发送特征分析主题,在SAS平台上实现了数据仓库架构的搭建,并实现了SAS与DBMS数据源连接抽取数据。在本课题研究的基础上,将实现铁路数据资源在数据仓库内的完全整合,构造统一的数据存储结构,为数据的分析和利用以及今后对数据的深度、广度挖掘提供了标准的、全面的数据源。
|