摘要: |
智能交通系统(ITS)已经成为21世纪交通运输体系的发展趋势,其实质是对交通信息的分析、共享和综合利用。数据挖掘,简单地说,就是从大量数据中提取或“挖掘”知识。分类分析是数据挖掘的一个重要组成部分,决策树分类又是分类分析中最为典型的方法。在交通数据分析中使用决策树分类技术,并学会一个分类模型,能够有效地利用海量交通数据进行交通状况的分析和预测。
交通拥塞是困扰城市交通的一种常见交通现象。在历史交通拥塞相关数据的基础上使用数据分类技术,能很大程度上去发现城市交通中的拥塞知识,从而做到对拥塞的估计和预防。发现交通拥塞知识首先必须学会交通拥塞分类模型,我们把这种分类模型称之为“交通拥塞分类器”。
基于以上理论,本文着重于分类算法及在此基础上建立的“交通拥塞分类器”的研究。在简要介绍了数据挖掘与分类技术的基本知识后,基于上海安装的交通数据采集分析系统SCATS采集的交通数据,本文首先分析了交通数据的特点并着重讨论了交通数据的预处理技术,在通常的只分析动态交通数据流属性的基础上增加了对城市道路本身的静态地理空间属性的分析。然后,讨论了急切分类决策树算法C4.5,针对C4.5算法构造分类模型时间开销较大,而且时效性较差的缺点,提出了一种基于懒散分类的改进算法:LDTA。该算法的思想是将懒散的基于示例的方法和C4.5分类方法有机的进行结合,从而可以充分发挥它们的优点,克服各自的缺点。这样就有效地提高了算法的时效性、运算速度,而又有较高的分类精确度。另外,本文从减少分类器分类复杂度、提升分类性能的角度出发,提出了构建“二层交通拥塞分类器”的思想,即分类器采用分别对静态地理空间属性和动态交通属性进行分类的分类器结构。实验表明,该分类器在对交通进行拥塞分类预测时达到了较好的效果。
最后,本文讨论了“交通数据分析和查询系统”,分析了其中使用的交通数据仓库模型以及系统的结构和功能,并就其中“二层交通拥塞分类器”的实际应用情况作了介绍。
|