论文题名: | 基于车牌识别数据的城市交叉口短时车流量预测 |
关键词: | 交叉口流量;机器学习;高维聚类;交通状态 |
摘要: | 智能交通系统对提高交通管理水平有着极帮助,短时车流量预测有助于完善智能交通系统在交通诱导、信号调配、信息发布等方面的功能。短时车流量极易受到影响而波动,文献中有众多建模方式选取其中部分因素进行分析,但综合来说现有成果应对不确定性、非线性的因素时的表现距离实际应用要求的精准度和可靠性仍有差距,且可移植性差,当路口的车道数及流量分布发生变化时,模型通常需要重新选取因素建模。随着计算机的计算能力提升和集成算法的出现,利用多源多维度的大数据来支撑具备普适性强的模型进行预测成为可能。众多文献表明,定制化的机器学习算法能够建立具备较强适用性的模型,这对于短时车流预测将有很大帮助。 本文分别基于支持向量回归(SVR)、随机森林(RF)和轻量级梯度提升机(LightGBM)建立针对不同交通状态的车流量预测模型,由顶层聚类算法智能识别模型适用的交通状态,提升了整个体系的预测能力。本文主要工作内容和研究成果如下: 1、根据实际分析影响车流量的固定因素和随机因素,构建完备的特征集;经过数据预处理,缺失数据填充、速度修正、异常数据的处理等,将已有的卡口交通数据统计为特征所对应的数据集。 2、分别基于SVR和RF建立车流量预测模型,将随机搜索算法通过给定搜索方向进行改进,用于模型的超参调优。在SVR预测模型建立过程中,基于相关性分析进行特征子集的选择;在RF预测模型建立过程中,以动态选择特征变量和固定值累积重要性的方式选择特征变量,有效降低模型复杂度,新特征子集下的模型训练速度分别提升了31.43%和42.2%。同时,研究了实际运行时出现的检测设备故障导致部分重要特征丢失等常见问题,RF模型预测精度下降了1.5%,具有一定的稳定性。 3、探究LightGBM在城市交叉口车流量预测问题的应用,将粒子群算法应用在模型的超参寻优的过程中,并改进粒子群算法的速度更新方法,以提升算法的收敛速度,提出SPSO-LightGBM预测模型,以验证集来验证模型的效果,得到了本文最高精度为91.17%,平均预测车流量误差为6.32辆;最后分析了该模型在调参方面的困难以及对比验证了受异常值影响较大的缺点,给出模型适用场景。 4、通过一种高维聚类算法进行不同交通状态的分类,将类别中部分特征的数学统计量解释为现实的交通状态,将模型在不同交通状态下的表现进行对比,给出不同模型的适用情况,即支持向量机适用于小规模数据,数据变化平缓的情况;随机森林在应对大规模数据时运行速度更快,在数据波动较大的状态下表现优于支持向量机;梯度提升在应对较大数据规模时精度更高,但容易受到异常值影响,且超参调节较为复杂。 |
作者: | 杨鹏 |
专业: | 控制工程 |
导师: | 邹难 |
授予学位: | 硕士 |
授予学位单位: | 山东大学 |
学位年度: | 2021 |