论文题名: | 因子关联树数据挖掘模型的构建及其在交通事故分析中的应用 |
关键词: | 因子;关联规则挖掘;数据挖掘模型;构建;交通事故分析系统;属性值;关联关系;道路交通事故;挖掘数据库;层次;主导因素;挖掘方法;特征变量;属性集;生命财产损失;规律;关联数据挖掘;信息熵原理;相关性分析;时分析系统 |
摘要: | 发现数据间的关联关系是数据挖掘的主要目的之一。关联规则挖掘方法是数据挖掘的主要方法之一,它用于挖掘数据库中项目之间的关联,揭示数据库中隐藏着的具体的关联规律。但这种具体的、细节的关联规则所揭示的关联规律有时并不能满足用户的全部需要,有时也需要研究属性甚至属性集之间的相关性。当研究某复杂系统时,有时分析系统特征变量间的相关性是很必要的——可以简化系统的描述,也可以发现影响系统行为的主导因素,发现问题的主要矛盾所在,从而评价系统的行为特征并制定决策。系统的特征变量可以看做一个属性,发现系统变量间的相关性就转化成了研究属性间的相关性。 从广义上讲,无论是关联规则挖掘,还是属性(集)的相关性分析,都属于数据挖掘的关联关系挖掘范畴。本文将关联规则中的项目看作某属性所包含的属性值,因此关联规则所反映的是属性值间的关联。由此关联规则、属性相关和属性集相关三者关系密切,且在结构上层次逐级提升。可以说,要想比较完整地挖掘数据库中蕴含的关联关系,应该从这三个层次逐一进行。 基于这种完整的、全面的、多层次的关联数据挖掘目的,本论文构建了一种基于关联规则挖掘方法和信息熵原理的、专门用于挖掘大量数据间隐藏的不同层次的关联关系的特殊数据挖掘模型——因子关联树数据挖掘模型。此模型不仅在结构上体现除了关联分析的层次性,且采用的算法也体现了自下而上、逐级提升、一脉相承的原则。本文在最后将因子关联树分析法应用于道路交通事故分析系统中,成功地从大量相关因素中发现影响事故的主导因素,从各个层面上掌握了交通事故中的一些隐藏的有价值的规律,可以用以辅助相关部门采取妥善措施,及时、有效地降低道路交通事故给国家和人民带来生命财产损失。 |
作者: | 王艳玲 |
专业: | 电路与系统 |
导师: | 王双维 |
授予学位: | 硕士 |
授予学位单位: | 东北师范大学 |
学位年度: | 2010 |
正文语种: | 中文 |