当前位置: 首页> 学位论文 >详情
原文传递 基于关联规则的数据挖掘算法的分析与改进及在铁路机务段机车故障分析中的应用
论文题名: 基于关联规则的数据挖掘算法的分析与改进及在铁路机务段机车故障分析中的应用
关键词: Aprioir算法;MFCS;双向搜索;数据库;机车故障分析
摘要: 关联规则的发现是数据挖掘工作中的一个重要任务.目前已有几种成熟的典型算法用来实现关联规则数据挖掘任务.这些算法中的大部分算法需要反复遍历数据库以完成计算支持度,寻找侯选项,最终寻找大项集的操作,同时这样的结果便是引起了大量的数据库I/O操作.典型的关联规则挖掘算法如Aprioir算法一般采用自底向上,广度优先的搜索策略.这种计算从频繁1一项集(最小长度的频繁项集)开始直至所有的最大(指长度)频繁项集被发现为止.在整个的过程当中,每一个频繁项集都被仔细地计算.当所有的最大频繁项集都很短的时候,这样的算法很有效.然而当某些最大频繁项集变得相对长些的时候,这种算法的执行效率就会大大地下降.针对上述问题,我们并结合对唐山机务段信息系统检修数据挖掘的具体应用,对关联规则挖掘算法进行了改进.我们将该算法应用于我们开发的唐山机务段检修数据库中,比较了改进后的算法和经典Apriori算法的执行表现,证明该算法比Apriori算法速度上可以提高一个数量级.挖掘出的结果尽管有待完善,但仍可以为唐山机务段用户提供一些有价值的信息.该文首先对关联规则数据挖掘算法进行了分析,重点介绍了在铁路机务段项目应用的过程中对算法做的改进并如何将改进的算法应用到机车故障分析中.
作者: 董文博
专业: 计算机应用
导师: 朱卫东
授予学位: 硕士
授予学位单位: 北方交通大学
学位年度: 2002
正文语种: 中文
检索历史
应用推荐