当前位置: 首页> 学位论文 >详情
原文传递 数据挖掘技术的研究与应用
论文题名: 数据挖掘技术的研究与应用
关键词: 数据挖掘;关联规则;Apriori;港口信息管理;航道养护费征稽;关系型数据库
摘要: 随着数据库技术的逐渐成熟和计算机网络的迅速普及,人们采集数据的能力得到了极大的提高,导致全球范围的信息急剧膨胀,为了对这些海量信息的隐藏知识进行开发,数据挖掘技术应运而生。目前,数据挖掘技术愈来愈成熟,应用范围也日趋广阔,但是,在港口信息领域还缺乏专门的研究。伴随着我国经济的发展,我国港口的规模也不断扩大,货物吞吐量也跟随着急剧增长。在各大港口采取信息化运作的背景下,港口信息已经由以往的手工操作转化为目前依靠网络技术的自动化操作,并且已经积累了一定数量的信息。跟其它领域一样,港口信息中也蕴含着潜在的有价值的知识有待于发现,这些知识能够为企业良好经营和决策部门做出重要决策提供帮助,所以对数据挖掘技术在港口信息管理中应用的研究就成为了当务之急。 本文是数据挖掘技术在港口信息管理系统领域的一个初步尝试,试图验证数据挖掘技术在这个领域中的可行性。 首先,介绍了数据挖掘技术的基本原理与概念,以及数据挖掘的任务,方法和步骤。着重研究了关联规则挖掘技术,本文在原始Apriori算法的基础上进行了改进,在生成新的项集的同时,减小原始数据库的规模,降低了算法扫描数据库的次数,有效地提高了算法的效率。 其次,介绍了本文的数据挖掘对象-航道养护费征稽管理系统的设计模型和数据库结构,讨论了基于信息管理系统的数据挖掘应用,并分析了在关系型数据库中进行数据挖掘的可能性以及方法。 最后,论文按照数据挖掘的标准步骤,对数据库原始表依次进行了数据选取,数据清洗,数据转化,使其成为适合于数据挖掘的文本数据源。并用Apriori算法进行挖掘,输入最小支持度阈值和最小置信度阈值,输出所有的频繁项集和强关联规则。根据强关联规则,发现了隐藏在港口信息中的一些规律。
作者: 吴辉
专业: 计算机应用技术
导师: 熊前兴
授予学位: 硕士
授予学位单位: 武汉理工大学
学位年度: 2009
正文语种: 中文
检索历史
应用推荐