论文题名: | 交通事故数据挖掘的多维关联规则研究 |
关键词: | 交通事故;事故分析;数据挖掘;多维关联规则 |
摘要: | 随着车速提高、交通量增长,道路交通事故已日益引起各有关部门的重视。交通事故的发生受多种因素的影响,能否对已发生事故做出正确的分析将直接影响到能否对未来类似事故的成功避免。随着社会的发展,交通事故的复杂性也在逐渐增强,传统的分析、预防方法已呈现其局限性。本文提出一种利用数据挖掘领域中的多维关联规则技术从记录交通事故的海量数据中寻找有用信息的方法,通过找出可能导致交通事故发生的频繁因素组合来发现某些事故诱因之间联系的内在规律。如果根据事故诱因之间的联系规律,进行人为控制和干预,使事故发生条件缺失,可以降低交通事故发生的概率。 数据挖掘(Data Mining)是一个从海量有噪声、不完整数据中挖掘出有意义知识模式的过程。数据挖掘方法的提出,让人们有能力发现海量数据中蕴藏的有用信息。关联规则是数据挖掘的主要方法,反映一个事物与其它事物之间的相互依存性和关联性[1],是指在数据集中支持度和置信度分别满足给定阈值的规则。关联规则挖掘的经典Apriori算法就是根据有关频繁项集特性的先验知识而命名的,算法中蕴含的一条基本性质是一个频繁项集的任一子集均应是频繁的。借助一定的专业领域知识,关联规则可以直接用于分析数据的因果关系,进一步探索,做出规则预测。从大量的数据中发现其关联关系对于决策分析是极为有用的。 本文针对道路交通事故这一实际问题,对经典单维单层的Apriori算法进行改进,实现挖掘多维多数据类型关联规则的新算法;给出了道路交通事故属性的定义,并且采取全星型连接数据模型对道路交通事故属性的数据组织建模;将大量杂乱无章的交通事故数据组织为可进行数据挖掘的属性信息,用于分析各种相关因素间的复杂关系;通过数据挖掘的关联规则技术处理交通事故数据,提取和分析了道路交通事故的规律;重点分析、阐述了车辆事故属性数据关联规则提取的算法,然后对该算法进行了验证。 用本文的方法对交通事故数据进行提取、分析得到关联规则,展现了关联规则提取技术的使用价值。对于本文建立的道路交通事故属性的数据模型,可以进一步细化,以便能够包含更多的信息,而进行更详细的数据关联规则分析。 |
作者: | 付志强 |
专业: | 通信与信息系统 |
导师: | 陈曙 |
授予学位: | 硕士 |
授予学位单位: | 山东大学 |
学位年度: | 2009 |
正文语种: | 中文 |