摘要: |
近年来,随着我国经济建设的持续高速发展和城市现代化进程的加快,城市智能交通建设得到了长足的发展。智能交通系统中积累了大量的交通数据,为数据挖掘技术在城市交通领域中的发展提供了广泛的数据支持。同时,交通数据的实时性和复杂性也对数据挖掘技术的发展提出了巨大的挑战。
本文以车辆GPS信息为研究内容,以分类模型为研究主线,对数据挖掘过程中几个重要阶段(包括数据预处理技术、数据挖掘建模、模型评估)及其具体技术分别进行了研究:
首先,介绍了数据挖掘技术产生的背景,定义和功能,及其在交通信息数据处理领域的研究现状。接着着重阐述了数据挖掘中的分类技术,从分类的一般方法入手,分析并比较了几种不同分类方法和分类性能评估方法。分类方法包括决策树,K-最近邻分类,神经网络和贝叶斯分类;分类性能评估方法包括保持方法,随机二次抽样,交叉验证和自助法。
其次,分析了数据挖掘中的预处理技术。其中最重要的技术是数据离散化和属性简约。这两种技术分别被运用到了对车辆GPS数据,包括经度坐标,纬度坐标,速度,角度的处理中。研究了决策树分类模型,基本算法以及具有可伸缩性的改进算法。提出了用分类树的方法解决单个车辆GPS坐标匹配多条道路的问题。该方法利用精确匹配的车辆GPS坐标训练和生成决策树,在利用该决策树判断可能匹配多条道路的车辆GPS坐标。
最后,研究了模糊粗糙集理论,提出了在现有认识能力有限的条件下分析和解决复杂问题的一般方法。将其应用于道路交通状况预测中,完成基于模糊粗糙集的道路预测模型和算法。该模型通过计算道路交通状况的模糊上近似和模糊下近似来预测路况。对比预测结果和实际数据,证明该模型具有一定的准确性。
目前,随着数据挖掘技术在各个领域中的不断发展,人类发现知识的方式正在不断的改变。数据挖掘技术在智能交通系统中的应用研究,也必将促进未来城市道路交通的发展。 |