摘要: |
在信息技术特别是数据库技术高速发展的背景下,目前各行各业都存储了大量的数据,港口企业也不例外。而这些数据往往呈现分散存储、数据结构不统一、数据冗余、数据不完整等特征,使得数据难以集成为统一的数据平台。面对大量纷繁复杂的数据,传统的数据分析手段难以应付大量的数据,从而导致越来越多的数据灾难。关系数据库提供的简单查询和报表生成功能,只能获得数据的表层信息,而不能获得数据属性的内在关系和隐藏的信息,即淹没了的信息乃至知识,造成了资源的浪费,因此怎样合理地利用这些数据成为了一个重要的信息资源管理问题。数据仓库、联机分析处理、数据挖掘技术的发展为解决这一问题提供了有效途径。
关联规则挖掘作为数据挖掘领域的一个重要研究课题,它在许多实际应用中都发挥着重要作用。本文以营口港的港口生产交易数据为应用背景,在前人对数据仓库和关联规则挖掘研究的基础上,构建了港口数据仓库及其数据立方体模型,并且设计并实现了一个基于数据仓库和OLAP技术的关联规则挖掘。论文的主要研究工作如下:
第一,介绍了论文的研究背景及研究意义,包括国内外在这一方面的发展现状及进一步研究方向。同时介绍了数据仓库、数据立方体、OEAP和关联规则的概念,关联规则挖掘的分类、方法及常用的经典算法;
第二,详细阐述了港口运营分析数据仓库和数据立方体的构建过程,这部分包含了业务需求分析、数据分析、总体设计、数据模型设计、数据预处理、立方体维层次聚集表示等步骤,这是论文的一个研究重点,也是论文下一步关联规则挖掘研究的基础;
第三,详细阐述了基于数据仓库和OLAP技术的关联规则挖掘模型的设计与实现,这是论文的另一个研究重点。该模型在分析港口数据和现有关联规则挖掘FP-growth算法的基础上,提出了改进的适合现有港口数据的MD&MLFP算法,实现了在数据立方体基础上的多维多层关联规则挖掘,并对挖掘出来的规则从市场管理、船商管理和航运路线等多角度进行了分析,辅助了港口管理人员的决策。
最后对全文的工作进行总结,并且对下一步的工作进行了展望。
|