论文题名: | 基于时间序列聚类的交通数据分析与预测研究 |
关键词: | 交通数据分析;时间序列聚类;K-means聚类;供需模式 |
摘要: | 交通行业当前正处于数字化转型的上升期,大数据分析技术的大规模运用使得城市的交通管理向大数据时代迈进。聚类算法作为大数据分析技术中的重要成员,已为众多领域的智能化发展赋能。为了提高现有聚类算法在城市交通领域的适用性,本文着眼于提供与交通领域的大数据分析具有较高适配程度的聚类算法,能够在大数据交通的数据背景下发挥其优良性能,挖掘潜在有效交通信息,为城市交通的智能化发展和科学化决策提供辅助与参考。 本文提出一种基于时间序列的加权K-means聚类算法,并基于所提算法进一步提出一种基于加权K-means聚类算法的Holt预测预警算法和一种基于加权K-means聚类算法的多元回归预测模型,并将三种所提算法应用于北京市的交通数据分析与预测研究中。本文的主要研究内容与研究结论如下所示: (1)由于时间序列数据中的每个样本数据在不同采样时间下的重要性并不完全相同,因此采用变异系数来分配权重以改进K-means聚类算法,提出一种基于时间序列数据的加权K-means聚类算法。基于北京市城六区2017年1月1日至2017年12月31日期间的交通拥堵指数数据,将所提加权K-means聚类算法应用于北京市的交通拥堵模式分析。研究结果表明,交通拥堵模式既具有时间依赖性,又具有空间相关性。 (2)利用加权K-means聚类算法可以识别时间序列数据的历史运行模式的特性,将所提加权K-means聚类算法与Holt预测算法相结合,提出一种基于加权K-means聚类算法的Holt预测预警算法。将此算法应用于城市道路流速的模式识别与实时预测预警,基于北京市高速公路从2020年4月3日至2020年5月20日的真实道路路段交通流速数据进行的案例研究结果表明,所提预测预警方法具有较好的应用效果。 (3)将通过加权K-means聚类算法识别的历史模式作为多元线性回归预测模型的一个自变量,结合其它自变量的输入,提出一种基于加权K-means聚类算法的多元回归预测模型。以北京西站2019年8月1日至2019年10月15日、2020年8月1日至2020年8月31日的多源交通数据集为基础,探讨巡游车和网约车的运行规律和需求预测,所提预测模型的拟合优度R2均大于0.8。研究结果证实,所提预测模型具有良好的预测性能。 本文中城市交通拥堵模式的识别、城市道路路段流速的预测预警和城市重要场站的交通出行需求预测这三个算法应用场景都与城市交通管理系统息息相关。本研究证明了加权K-means聚类算法及其衍生算法的良好应用性能,实例研究结果也对制定具体的交通优化和控制方案,缓解交通拥堵,改善交通状况具有重要的现实意义。 |
作者: | 桂佼 |
专业: | 管理科学与工程 |
导师: | 李想 |
授予学位: | 硕士 |
授予学位单位: | 北京化工大学 |
学位年度: | 2022 |