论文题名: | 基于DW-Ba-Stacking模型的短时交通流量预测 |
关键词: | 短时交通流;模型优化;DW-Ba-Stacking模型;预测模型 |
摘要: | 近年来交通拥堵现象日益严重,给人们的生活带来了极大不便,因此急需完备的技术和方法对交通进行管理和诱导。智能交通系统能通过融合网络技术、通讯技术等信息技术,全方位实现对车流动态信息的监控和管理,从而解决传统交通管理不及时和不科学等问题。交通流量作为数字化所需的重要参数,对其准确预测具有重要意义。为提高单一模型的预测精度,本文引入Stacking模型;为改善传统Stacking模型基学习器利用率低的缺点,本文对传统Stacking模型进行了改进和优化,具体研究内容如下: (1)为改善传统交通流量预测模型特征结构简单的缺点,引入节假日、高峰时间特征和占有率、速度特征来增强其表达能力,实现数据特征的深入挖掘。其中节假日特征和高峰特征为检测仪记录时间分解的分类特征,占有率和速度特征为前四个时间段的历史特征。 (2)针对单一模型在流量预测中的局限性,考虑建立融合不同单一模型优点的Stacking模型,并在此基础上构建Ba-Stacking模型来减小单一模型的波动误差。首先建立以随机森林、KNN、决策树、GBDT、Xgboost和GRU为基学习器,以岭回归为元学习器的Stacking模型。再从学习器角度优化Stacking模型,先利用pearson分析基学习器间的相关系数,筛选有效的基学习器;再通过不同元学习器的对比分析得到最优的Stacking模型;最后利用Bagging模型优化基学习器,将优化的学习器作为新基学习器嵌入到Stacking模型中,得到Ba-Stacking模型。实验结果证明Stacking模型能有效提高单一机器学习模型的预测精度,而Ba-Stacking模型又进一步提高了Stacking模型的预测精度。 (3)针对Ba-Stacking模型对基学习器利用率低的缺点,构建能改变基学习器权重的DW-Ba-Stacking模型来调整特征分布,从而提高利用率。DW-Ba-Stacking模型的关键在于权重系数DW的设计,其中所涉及的元学习器包括GRU和岭回归两种,对GRU元学习器通过设计注意力机制来改变模型内部权重,改变基学习器特征分布情况;对岭回归元学习器,在考虑影响模型外部特征情况下,分别以误差系数和熵值系数进行加权,修正基学习器信息结构。实验结果证明DW-Ba-Stacking模型相比于Ba-Stacking模型有更高的预测精度,实现了Ba-Stacking模型的改进。 |
作者: | 殷铭 |
专业: | 管理科学与工程 |
导师: | 李朝辉 |
授予学位: | 硕士 |
授予学位单位: | 大连海事大学 |
学位年度: | 2021 |