当前位置: 首页> 学位论文 >详情
原文传递 数据挖掘技术在智能交通系统(ITS)数据分析中的应用
论文题名: 数据挖掘技术在智能交通系统(ITS)数据分析中的应用
关键词: 数据挖掘;数据仓库;智能交通系统;数据分析;交通拥堵
摘要: 智能交通系统(ITS)已经成为21世纪交通运输体系的发展趋势,其实质是对交通信息的分析、共享和综合利用。数据挖掘,简单地说,就是从大量数据中提取或“挖掘”知识。分类分析和关联分析是数据挖掘的两个重要组成部分。在交通数据分析中通过对交通拥堵数据进行分类分析和对交通事故数据进行关联分析,能够有效地利用海量交通数据进行交通状况的分析和预测。 交通拥堵是很多交通因素共同作用的结果。根据交通拥堵数据各属性之间的关系特点,以及交通数据各属性和交通拥堵状态的相互关系,对历史交通拥堵数据使用数据分类技术,可以很大程度上去发现城市交通中的拥堵规则,从而做到对拥堵的估计和预防。 交通事故的发生受人、车、路等多种因素影响。通过关联分析发现道路交通事故数据中驾驶员、车辆、道路、天气、时间等各种因素之间的关联规则,就可以判断导致道路交通事故发生的可能性。 本文的主要工作包括: (1)建立基于数据挖掘的交通拥堵信息和交通事故信息数据模型 根据交通信息特征,提出了采用数据仓库进行数据存储,采用数据挖掘方法进行数据分析。数据在数据仓库中的组织形式称为数据模型。数据仓库采用星型模型建模,是进行数据挖掘的绝佳平台。针对数据挖掘对交通拥堵信息和交通事故信息的要求,分别建立了相应的数据模型。 (2)利用C4.5算法进行交通拥堵数据分析 采用数据挖掘中分类分析的方法对交通拥堵进行数据分析。C4.5算法采用信息增益率作为属性选择的标准,可以处理连续属性,适合交通信息数据分析。本文采用的即是C4.5算法,以常州市交通数据信息为背景,通过相关实验证明,可以达到很好的效果。 (3)改进Apriori算法并利用此算法进行交通事故数据分析 采用数据挖掘中的关联分析方法对交通事故数据进行数据分析。Apriori算法只能在单维单层的数据模型上进行挖掘,不适合交通数据这种多维的数据模型。本文通过对Apriori算法进行改进,将交通事故数据模型中的每个维看成是一个谓词,把关联分析中对项集的操作变为对谓词集的操作,便可以分析多维数据模型。仍以常州市交通数据信息为背景,提取了很多有用的关联规则,其与实际情况基本相符。
作者: 窦伟
专业: 控制理论与控制工程
导师: 赵霁
授予学位: 硕士
授予学位单位: 东南大学
学位年度: 2009
正文语种: 中文
检索历史
应用推荐