摘要: |
目前时空信息系统及时空数据挖掘理论越来越引起专家和学者的关注。这是因为随着信息技术的发展,人们已经不满足于单纯的空间数据的存储和展现,而是需要更先进的手段帮助理解空间数据的变化,发现空间数据之间的动态关系。实际上,很多空间现象是随时间动态变化的,很多应用领域,例如交通管理、环境监测、地震救援等,在问题求解过程中需要同时考虑时间和空间两方面因素。因此时空数据挖掘是一项很有意义的研究,具有非常广泛的应用前景,不过这方面的研究还不是很多。客流预测一直是交通运输行业的重要的信息需求之一,由于铁路交通信息系统是典型的具有时空特征的混杂系统,因此适合铁路运输特点的时空预测技术能为客流预测提供更好的解决方案。
本文对时空数据挖掘理论及应用进行了研究。主要包括:构建了时空数据挖掘的体系结构;研究了时空本体及基于时空本体的时空数据挖掘方法;扩展了空间自回归预测算法,提出了用时空邻接矩阵和时空邻近度表达模型中的时空关系的方法;并针对铁路客流预测问题提出了基于数据融合和方法融合的时空综合预测算法。主要的研究内容有:
1.提出了基于细胞自动机理论的时空本体及其语义粒度方法。论文详细分析了时间、空间和时空关系,从本体论角度,研究了时间和空间一体化表示和处理的方法,提出了基于细胞自动机理论的时空本体及其语义粒度方法,以及基于时空本体和语义粒度的GIS综合方法,并在铁路客运地理信息系统(GIS)中给以运用。
2.提出了时空数据挖掘体系架构和通用时空数据挖掘方法。总结了时空数据挖掘相关的理论、方法和技术,针对目前时空数据挖掘研究中存在的单纯解决具体问题的应用研究较多而基础理论研究薄弱的状况,提出时空数据挖掘体系结构和通用时空数据挖掘方法。论文还研究了基于本体的时空数据挖掘与面向领域应用的时空数据挖掘,并对时空数据挖掘在铁路领域的应用进行了分析。
3.提出了通用时空预测模型和基于本体的时空预测模型,对几种空间自回归方法进行了时间扩展,提出了通用时空回归模型的形式化表达,并分析了几种时空模型之间的关系。论文还研究了基于本体的时空预测模型,提出了两种表示时空自相关的度量方法:时空邻接矩阵和时空邻近度。针对铁路客流中、长期粗粒度预测对每种时空预测方法给出了详细的实验结果和分析。
4.提出了基于数据融合和方法融合的铁路客流时空综合预测方法,分析了当前铁路客流预测方法的特点和不足,针对细粒度短时客流预测,提出了基于数据融合和方法融合的时空综合预测方法。在为铁道部运输局假日办公室开发的铁路假日客运地理信息系统中用该方法对春运期间直通区段的旅客发送量进行预测,实验结果表明,时空综合预测方法好于单独的时间预测、空间预测和时空预测,也好于传统的客流预测方法。
|