论文题名: | 基于自适应时间序列分解的路网级交通流集成预测及可解释性分析 |
关键词: | 交通流预测;时间序列;集成经验模态分解;可解释性 |
摘要: | 交通流预测是智能交通系统的关键组件,亦是主动交通管控的重要技术支撑。根据预测的空间范围,可以将交通流预测技术划分为点线级预测和路网级预测两大类。近些年来,随着人工智能技术的突破式发展,基于深度学习的路网级交通流预测成为交通预测领域的一项研究重点与热点课题。面向路网级交通流预测,既有研究仍存在以下三方面不足,使其难以在当前主动交通管控的应用中发挥关键作用。首先,当前大部分研究主要以采集的原始交通流时间序列作为模型训练输入,建模过程中未能充分考虑和利用交通流时间序列中不同成分的特性,致使模型预测性能受到局限;其次,既有研究大多通过构建单一模型实现预测,然而单一模型受所使用训练算法特性及参数设置的影响,其预测精度和鲁棒性亦会受到局限;最后,现有主流的基于深度学习的路网级交通流预测模型虽然具有优良的预测精度,然而其工作机理通常为“黑盒”式的,难以被决策人员所理解。考虑上述问题,本文首先利用集成经验模态分解技术对路网各断面交通流时间序列进行自适应分解,以有效分离和提取交通流时间序列中具有不同特性的模态分量;在此基础上,通过构建三维时空深度张量,并建立基于图卷积网络和门控循环网络的路网级交通流集成预测模型,从中充分挖掘和提取路网交通流数据隐含的时空依赖关系,进而实现精准的路网级交通流单步和多步预测;最后利用SHAP算法和基于梯度的可解释性算法,结合可视化分析技术,对所构建的模型从多个角度进行可解释性分析,揭示其有效性原因。论文的核心研究工作包括路网交通流数据综合预处理、基于时间序列自适应分解和深度学习的路网级交通流集成预测建模、路网级交通流预测模型可解释性分析三个方面,主要的研究工作、成果及结论总结如下。 在路网交通流数据综合预处理方面,首先利用阈值法和三参数一致性检验法对路网各断面采集的交通流平均速度数据进行有效性检验,包括无效数据检测、异常数据检测和缺失数据检测三个方面;然后利用贝叶斯张量分解算法对原始交通流数据中的无效数据进行缺失填充,从而为交通流预测模型的建立提供可靠数据支撑;最后对预处理后的路网交通流数据进行特性分析,主要包括周期性分析和时空相关性分析,以此为后续路网交通流邻接矩阵和相关系数矩阵构建以及路网交通流预测建模奠定基础。 在路网级交通流集成预测建模方面,首先利用集成经验模态分解方法将原始交通流时间序列分解为具有不同特性的多个模态分量,以此为有效分离和充分提取交通流数据模式打下良好基础;为在预测建模过程中有效刻画路网交通流在时间、空间和不同时间序列模态分量之间的相互依赖关系,本研究以提取的多模态分量为基础构建了路网交通流时空深度张量,在此基础上,考虑不同预测模型之间的互补性,利用深度学习和集成学习技术,建立基于图卷积网络和门控循环网络的路网级交通流集成预测模型,通过图卷积网络刻画路网交通流的空间关联关系以及不同模态分量之间的相互依赖关系,通过门控循环网络刻画路网交通流的时间关联关系,最后通过集成两类预测模型输出提升模型预测精度和鲁棒性。利用我国昆山市和美国马里兰州采集的两类城市路网交通流数据对所提出的预测方法进行评估和验证。实验结果表明,相较于经典统计时间序列模型、基于传统浅层机器学习的模型和基于深度学习的模型等7个基准模型,本文所构建的模型在单步预测和多步预测两个方面均具有显著的性能优势。 在路网级交通流预测模型可解释性分析方面,首先通过时空关联性分析验证了预测模型可以有效提取交通流时空关联信息;然后利用SHAP可解释性机制,从局部可解释性和全局可解释性两个角度量化分析不同模态分量和时间滞后特征对预测结果产生的影响,揭示模型输入特征对于预测输出的支撑重要度;最后基于梯度加权类激活映射算法输出特征显著性热力图,对预测模型提取交通流空间依赖关系进行可解释性分析。通过对路网级交通流预测模型进行可解释性建模与分析,能够对模型预测机理进行深入揭示,为交通管理者进行主动交通管控提供可信任的决策支撑和理论依据。 |
作者: | 梁程 |
专业: | 建筑与土木工程 |
导师: | 聂庆慧;张韦华 |
授予学位: | 硕士 |
授予学位单位: | 扬州大学 |
学位年度: | 2022 |