论文题名: | 基于融合模型的广州机场高速公路的行程时间预测 |
关键词: | 高速公路;行程时间预测;长短期记忆神经网络;机动车总数量;融合模型 |
摘要: | 随着我国经济的日益强盛,我国的机动车总数量也在逐年递增,这使得高速公路的压力越来越大。为了缓解人们出行需求的急切增长所导致的高速公路交通供给与需求的矛盾,智能交通系统(IntelligentTransportationSystems,ITS)研究与建设得到关注,其中,高速公路的行程时间预测是智能交通系统实施过程中必不可少的环节,能有效提高公众出行幸福指数。 本文的基础数据集是来自广州市机场三元里至机场南路的收费数据,基于融合模型,给出该路段的行程时间预测。 首先,对高速公路行程时间的特性进行分析,包括周-日行程时间变化规律、日-时行程时间变化规律和周期性;再对初始数据集中的异常数据采用阈值法和标准差法进行剔除;选择路段编号、距离、前一期、前两期和前三期时间段内的平均行程时间、前一辆车的平均行程时间、上一个时间段内的平均速度标准差、小时、周天、一小时内的平均速度共计十个指标作为特征向量,利用min-max标准化,对距离、前一期、前两期和前三期时间段内的平均行程时间、前一辆车的平均行程时间、上一个时间段内的平均速度标准差和一小时内的平均速度共七个数值型特征向量进行归一化处理,再对路段编号、小时、周天这三个类别型特征向量进行独热编码处理,经过归一化处理和独热编码处理后消除量纲和量纲单位对模型的影响;通过随机森林算法的feature_importances_参数直接给出各特征向量的重要性,通过比较各特征向量的重要性进行特征筛选。 其次,使用随机森林算法和长短期记忆神经网络算法分别建立高速公路行程时间预测模型,利用广州市机场三元里至机场南路部分路段的数据,分别对两个模型进行训练,并将两个模型的输出作为贝叶斯回归模型的输入,最终得到融合模型的输出。 最后,对三个模型的预测结果进行对比分析。结果表明,基于融合模型的平均绝对误差MAE为1.68,均方误差MSE为3.26,平均绝对百分比误差MAPE为8.39%,均小于长短期记忆神经网络模型和随机森林模型在测试集上的误差。因此基于融合模型的预测结果更稳定,误差更小,预测能力更优。最后使用加拿大WhitemudDrive高速公路数据对模型的适用性进行验证,结果显示:基于融合模型的行程时间预测在进行短时行程时间预测时具有模型简便、运行时间短和精确度高的优点。 |
作者: | 杨靖文 |
专业: | 应用统计 |
导师: | 康剑灵 |
授予学位: | 硕士 |
授予学位单位: | 东华大学 |
学位年度: | 2022 |