当前位置: 首页> 学位论文 >详情
原文传递 AFC动态数据仓库应用系统的关键技术研究
论文题名: AFC动态数据仓库应用系统的关键技术研究
关键词: 地铁运营;AFC系统;动态数据仓库;异常检测;客流量预测
摘要: 为满足地铁运营管理人员对其系统中数据的价值挖掘需求,部分城市将数据仓库引入了地铁系统,但数据仓库中只有历史数据,不能为地铁运营管理过程中的战略战术决策的制定提供较好的数据支持。因此,本文提出将动态数据仓库引入地铁系统,构建AFC动态数据仓库应用系统,并对构建过程中所需解决的关键技术问题,即变化数据捕获、数据异常检测与处理以及数据存取处理过程中的查询竞争等问题展开研究。
  本文首先对动态数据仓库中的变化数据捕获技术、数据异常检测和处理技术以及数据存取处理技术的研究现状进行综述,并对数据仓库和动态数据仓库进行详细介绍;接着,详细分析了各主要变化数据捕获方法的技术原理及其优缺点,结合具体系统应用需求,最后选用基于日志的方法对ACC系统中的变化数据进行捕获,同时,对该方法中的日志记录读取和解析问题进行探讨,给出相应的解决方案,并完成了相应的变化数据捕获模块的架构设计工作;然后,基于南京地铁的进站交易数据,对进站客流量数据异常检测和处理方法进行研究,由于本文异常检测阀值范围计算是基于进站客流量数据预测模型进行的,故需首先进行进站客流量数据预测模型构建,本文首先通过CC方法和Wolf方法验证进站客流量时序数据的混沌特性并确定时序数据的时间延迟和最佳嵌入维数,对进站客流量时序数据进行相空间重构以得到模型训练样本集并对其进行归一化处理,同时,以支持向量机回归模型作为基础模型,采用集成学习方法来构建进站客流量数据预测模型,并借鉴Bagging和Random Forest的思想来生成模型集成中的各子模型,同时采用基于模型的方法对各子模型进行集成,生成最终的进站客流量数据预测模型,采用加入人工干扰粒子的方式对粒子群算法进行改进(记作WPSOwGS),并以此来优化集成模型参数,然后以大行宫站和上海路站的数据为例,按文中所述方式进行模型构建和模型参数优化,并应用本文方法进行数据异常检测和处理,实验结果表明,本文参数优化算法有效克服了传统方法易陷入极小值点的问题,并具有较好的参数优化效果,同时,按本文方法构建的预测模型与参照方法相比在模型预测效果方面亦优势明显,在异常检测与处理方面,与参照方法相比,本文方法在算得异常检测阀值范围明显变窄的情况下,异常检测的误报率也明显降低,即其具有更优越的数据异常检测和处理性能;其后,对现有的各查询竞争问题解决方案进行了分析和探讨,结合系统的具体应用需求,选用动态多级缓存的方法,并根据研究成果完成了AFC动态数据仓库应用系统架构设计工作。
  总体来说,本课题对AFC动态数据仓库应用系统构建过程中的变化数据捕获、数据异常检测和处理以及数据存取处理过程中的查询竞争等问题做了一些有益的探索,也为实际的AFC动态数据仓库应用系统的构建提供了理论和方法支撑。
作者: 张见
专业: 控制科学与工程;控制理论与控制工程
导师: 邵家玉
授予学位: 硕士
授予学位单位: 东南大学
学位年度: 2017
正文语种: 中文
检索历史
应用推荐