摘要: |
近年来,随着城市交通的不断发展,交通拥堵、事故频发、交通环境恶化及能源短缺等成为一个世界范围的问题,各国竞相投入大量的人力物力开发智能交通系统(ITS)。目前,作为交通智能化的一部分,包括上海在内的世界很多城市安装了先进的实时交通控制系统SCATS,它能够在进行交通控制的同时对交通数据进行记录。如何从这些数据中找到对交通部门的决策、人民大众的出行有用的知识成为一个迫切需要解决的问题。
由于交通数据的固有特点,传统的数据存储与分析手段已经不再适合交通数据分析的需要,而数据挖掘和数据仓库则不然。数据挖掘,简单地说,就是从大量数据中提取或“挖掘”知识。数据挖掘是一门交叉学科,涉及到许多学科,它从一开始就是面向应用的,利用数据挖掘技术,能够有效地利用海量交通数据进行道路状况分析、拥塞预测等任务。数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程。数据挖掘和数据仓库是融合与互动发展的。
本文着重于研究模糊聚类算法FCM在道路状况分析中的应用。在简要介绍了数据挖掘与数据仓库的基本知识后,本文首先讨论了交通数据采集手段并着重分析了交通数据的特点。然后,讨论了模糊聚类算法FCM,针对FCM算法收敛速度慢而在数据量较大时导致分析速度过慢这一缺点,提出了一种改进算法:首先通过对数据集进行单元划分并以单元格中数据对象均值作为输入来进行聚类,然后,以各个单元格内均值的类标号作为该单元格内的所有元素的类标号,从而有效地提高了算法的运算速度,并得到较好的聚类结果。然后,将改进算法应用于道路状况分析,并对分析结果进行了深入讨论。最后,针对实际应用,讨论了“交通信息分析与查询系统”的设计,并重点讨论了数据仓库和道路状况分析模块的设计。
|