论文题名: | 基于手机数据特征降噪的高速公路交通状态估计方法研究 |
关键词: | 密度峰值聚类;手机信令数据;数据降噪;交通状态估计 |
摘要: | 手机信令数据因其覆盖范围广、采集成本低和数据量大等优势,为交通状态的细颗粒、大范围估计提供了优越条件。然而,受各种复杂因素的影响,手机信令数据一般存在较高的数据噪声。而利用高噪声数据进行交通状态估计常常会影响估计结果,从而难以达到精度要求。因此,本文主要针对手机特征数据的噪声特点,提出改进的密度峰值聚类算法对数据噪声进行过滤,并建立基于手机特征数据的交通状态估计模型,利用降噪数据实现对高速公路交通状态高精度、细颗粒和广覆盖的估计。 本文首先对手机数据在交通领域的应用以及交通状态估计模型的研究现状进行了总结。在此基础上,对手机数据的采集原理和预处理过程进行了说明,对基于手机信令数据进行分路段、分方向的手机速度特征提取方法进行了介绍,并对基于微波雷达的数据采集原理进行了介绍。 针对原始手机特征数据的分布特点和数据噪声的主要来源,本文提出了基于改进密度峰值聚类算法(DensityPeakClusteringAlgorithm,DPCA)的手机速度特征数据降噪方法。考虑到传统密度峰值聚类算法中,截断距离参数一般为人为主观设定,同时聚类中心通过人工选取,从而难以实现针对不同数据分布特点进行自适应聚类和降噪的缺陷,该方法基于“数据场”和信息熵理论,优化了基于不同数据分布特点的截断距离参数自适应选取算法。在此基础上,结合高速公路交通状态划分标准和手机特征数据的具体特点,该降噪方法对聚类中心的自动选取和有效数据类的自动选择过程进行了优化,从而实现了对噪声数据的有效过滤。 在此基础上,本文建立了基于手机特征数据的交通状态估计模型。该模型以长短时记忆模型(LongShort-termmemory,LSTM)的基本结构为基础,以手机速度特征和数量特征信息作为输入数据,对相应路段和行车方向上的交通流速度进行估计。本文详细介绍了该模型中各层的数据流动以及各个门控结构的计算过程。 最后,本文以沪宁高速公路作为实例研究区域,以相关的手机特征数据和雷达数据为基础,对本文提出的数据降噪方法和交通状态估计模型进行了实例验证。结果表明,本文所提出的降噪方法能够有效过滤数据噪声,减少极端噪声数据的影响。而基于过滤数据训练和应用的模型,在交通状态的估计精度上有较为显著的提升,模型的输出结果能够较好地反映实际的交通情况。 |
作者: | 谢再春 |
专业: | 交通运输工程 |
导师: | 冉斌 |
授予学位: | 硕士 |
授予学位单位: | 东南大学 |
学位年度: | 2021 |