论文题名: | 基于复杂网络的交通流特征分析及组合预测研究 |
关键词: | 交通流;复杂网络;数据分析;支持向量机;组合预测 |
摘要: | 目前,交通拥堵、交通事故、环境污染等问题已经成为制约城市快速发展的主要障碍之一,严重影响了城市居民的生活质量和城市的吸引力。针对日益严重的交通问题,国内外学者和交通工程师在交通数据质量控制、交通流特征挖掘和交通流短时预测等三个方面做了大量的研究工作,取得了丰富的研究成果。 本文在总结以往研究的基础上,对采集的原始数据进行质量控制,以保障数据分析的合理性,同时对交通流特征进行了深入分析,提取周期性、局部波动性、随机性等特征,基于此建立了考虑周相似性的组合交通流参数预测模型。本研究主要取得了以下5个方面的研究成果。 (1)提出基于模糊C均值的丢失数据修复方法 尽管大量的交通检测技术已经获得了广泛应用,但是数据丢失成为了影响交通数据质量和完整性的最关键的问题之一。在本研究中,通过分析电感线圈的交通流数据,提出了一种基于模糊C均值(Fuzzy C-means:FCM)和遗传算法(Genetic Algorithm:GA))的交通流量数据修复方法。通过利用数据中蕴含的周相似性,首先将传统的基于向量的数据结构转变为基于矩阵的数据结构形式。随后,利用遗传算法优化模糊C均值中的隶属函数和聚类中心。在实验验证过程中,实际检测数据被用来证明算法的有效性。同时,采用均方根误差、相关性系数及相对精度3个指标评价修复效果。在模型验证过程中,与传统的修复方法进行了对比,比如历史平均值法(Historical method),双指数平滑(Double Exponential Smoothing: DES)以及自回归积分滑动平均模型(Autoregressive Integrated Moving Average model:ARIMA),分析结果表明本研究的方法要优于传统的修复方法。 (2)交通流复杂网络的构建方法 相空间描述了非线性系统进化行为,首先利用延时嵌入理论对原始相空间进行重构。随后,为了将新的重构时间序列转化为复杂网络,利用复杂网络的统计特性,包括度分布、累计度分布、密度和聚集系数等,确定了网络建模过程中的关键阈值。通过分析发现网络的度分布能够用指数函数进行拟合。密度和聚集系数的分析结果反映了复杂网络中节点相关性的变化,这些结果与基于邻接矩阵观察的结论相一致。基于此,确定了阈值的合理范围。 (3)利用复杂网络分析不同采样间隔下交通流特征 首先,通过感应线圈采集高速公路交通流量数据,利用Lempel-Ziv算法测算了不同采样间隔条件下交通流时间序列的复杂度。其次,为了更深入的理解交通流时间序列中的复杂性和周期性,通过考虑每一天为一个周期,假定每一个周期为一个节点,构建了基于交通流时间序列的复杂网络模型。通过分析复杂网络密度及其变化特性,确定了网络建模中的关键阈值。随后,分析了相关网络的统计特性,比如平均路径长度、聚集系数、密度、平均度和介数等。最后,以两分钟采样间隔数据为例,采样相关关系矩阵、邻接矩阵以及紧密性3个指标分析了交通流数据中周期性。 (4)利用复杂网络分析不同交通状态下交通流特征 通过采集高速公路感应线圈的交通流检测数据建立交通流模型,利用K均值法将交通流分为3种不同状态。然后,利用两种广泛应用的方法,相空间重构和可见性算法,将原始时间序列转化为复杂网络。在相空间重构中,讨论了如何确定延迟时间和嵌入维数,分析了如何根据累计度分布选择最佳的关键阈值。在可见性算法中,设计了一种基于逻辑或的多元时间序列复杂网络建模方法。最后,通过度分布,网络结构,聚集系数与介数相关性以及度度相关性等网络特性,分析和对比了不同交通状态下交通流数据的特征。 (5)提出基于指数平滑与支持向量机的组合交通流量预测模型 实时准确的交通流预测是实现智能交通系统的关键因素之一,首先建立双指数平滑(DES)模型进行预测,模型的平滑参数采用Levenberg-Marquardt优化方法计算确定。然后,采用支持向量机(Support Vector Machine:SVM)拟合DES模型与实际数据之间的残差。在SVM中,采用交叉相关规则优化其参数。最后,使用不同采样间隔下的实测交通流数据进行验证分析。在实例计算过程中,运用基于周相似性的作差和作比的数据平滑方法对实测数据预处理,通过对比DES、ARIMA及DES-SVM的预测效果,验证了组合预测模型及数据预处理的有效性。 |
作者: | 唐进君 |
专业: | 交通信息工程及控制 |
导师: | 王印海 |
授予学位: | 博士 |
授予学位单位: | 哈尔滨工业大学 |
学位年度: | 2016 |
正文语种: | 中文 |