当前位置: 首页> 学位论文 >详情
原文传递 基于铁路货运数据的序列模式挖掘问题的研究
论文题名: 基于铁路货运数据的序列模式挖掘问题的研究
关键词: 数据挖掘;关联规则;频繁项集;序列模式;数据仓库
摘要: 该文着重对时间序列数据的关联规则挖掘(即序列模式)进行了研究和分析.该文的主要工作包括:介绍了数据挖掘技术的由来、研究历史和现状,铁路货运数据系统的研究背景、铁路货运数据挖掘的意义.分析了数据挖掘的一般过程功能,并考察数据挖掘技术的、种类、所面临的挑战性问题、流行的数据挖掘语言和典型的数据挖掘系统.介绍了经典的Apriori挖掘算法,然后描述了对该算法的优化拓展,接着讲述脱离Apriori算法的方法;讲述了多层、多维关联规则的概念;归纳出关联规则价值衡量方法,接着介绍了关联规则的维护策略和更新算法.介绍时间序列数据库和序列数据库的几个重要方面,包括"趋势分析","相似性搜索","序列模式挖掘","周期模式挖掘".其中,序列模式挖掘是该文的重要讲述的内容的基础,并将在后续章节详细讲解.对数据仓库基本概念和体系结构的进行介绍;简单介绍了数据仓库的一个关键应用OLAP的相关技术;接着从技术融合的角度讨论了基于数据仓库和OLAP技术的数据挖掘以及OLAM技术;然后又简单介绍了铁路货运数据仓库及数据挖掘系统;最后研究了基于数据立方体技术的多维关联规则的挖掘技术.-I-基于铁路货运数据的序列模式的关联规则挖掘是作者在第三章和第四章的知识基础上完成的,也是全部工作的重点:首先简单介绍了关联规则的形式,并对关联规则的算法进行了详细讨论和分析;接着,介绍了序列模式的相关概念和定义,并结合具体例子加以说明,接着对序列模式算法的实现,分五个步骤,按流程的加以具体讲述与分析,并且对其中最重要序列阶段,给出了AprioriAll算法;在最后部分,结合铁路货运数据,对序列模式的的关联规则挖掘给出了结果案例.
作者: 张琪
专业: 计算机应用
导师: 黄厚宽
授予学位: 硕士
授予学位单位: 北京交通大学
学位年度: 2004
正文语种: 中文
检索历史
应用推荐