论文题名: | 基于关联规则的交通事故数据挖掘 |
关键词: | 交通管理;数据挖掘;关联规则;程序语言 |
摘要: | 随着城市的快速建设以及技术的不断进步,我国道路交通事业也得到了飞速的发展,但随之而来的还有不断增多的交通事故,导致人民与社会的安全面临极大的威胁。虽然目前智能交通系统的全面建设使得交通事故频繁发生的情况有所改善,但形势依然非常严峻,因此对交通事故数据的挖掘和分析具有很重大的意义。关联规则技术是数据挖掘理论中一种经典的技术,它主要是为了能够从大量的数据中寻找项目与项目之间隐含的关联信息,帮助相关人员做出合适的决策。关联规则最初的理论研究主要集中在针对频繁模式的挖掘,随着其理论研究的不断发展,它也扩展到了多种不同方式的挖掘。 本研究利用关联规则及其拓展技术对某市2015年内经过预处理后的交通事故数据从三个方面进行处理分析:一是在常规FP-Growth算法中添加维度信息,将其扩展到能够处理多维数据,构造多维FP-Tree,并利用频繁模式增长的方法找出所有的频繁模式;二是基于多维FP-Growth算法提出加权FP-Growth算法,利用加权关联规则理论对事故数据进行分析,根据信息熵理论计算事故各个影响因素的权值,挖掘出了更多的关于事故违法描述的频繁模式;三是在频数向量的基础上提出权重向量的概念,结合加权模型提出动态FP-Growth算法,添加加权支持度以及置信度向量来描述关联规则与时间变化的关联性,找到了各个关联规则表达式最适用时间段。最后通过关联规则表达式分析了该市范围内各因素对交通事故的影响。 |
作者: | 胡震波 |
专业: | 控制工程 |
导师: | 张军;朱昕炤 |
授予学位: | 硕士 |
授予学位单位: | 天津大学 |
学位年度: | 2016 |
正文语种: | 中文 |