论文题名: | 数据挖掘功能组件的设计与实现 |
关键词: | 数据挖掘;关联规则;铁路货票分析;数据仓库;DM2平台 |
摘要: | 数据挖掘是信息科学及其应用中一个非常有前景的发展方向。数据挖掘,也叫做知识发现,用于提取蕴涵于大型数据库、数据仓库、互联网、其它数据源、以及数据流中的代表有用知识的模式。如今,以爆炸性速度增长的数据使得人们迫切需要一种自动化的数据挖掘工具用于将大量数据转变为有价值的信息和知识。 DM2是一款由我们自行设计并开发的数据挖掘平台,该平台的设计目标是为了服务于中小型的数据挖掘项目。DM2平台不仅支持当今主流的数据库产品,如Oracle、MySQL、SQLSereer等,而且还与著名的数据挖掘实验平台Weka相兼容。目前,我们已经完成了平台核心结构的设计和开发,并在其基础上实现了ID3、Naive Bayes、FP-Growth、Closet等数据挖掘算法。 这篇文章主要介绍了DM2平台的详细设计思想,包括数据类型的设计,与数据库交互的方法,以及一些挖掘算法的基本原理等,同时本文还介绍了我们利用DM2平台在铁路货票数据上所进行的数据挖掘实验。 |
作者: | 纳跃跃 |
专业: | 计算机应用技术 |
导师: | 黄厚宽 |
授予学位: | 硕士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2007 |
正文语种: | 中文 |