论文题名: | 基于多源数据融合的城市路网交通流量估计方法研究 |
关键词: | 城市路网流量估计;多源数据融合;手机定位数据;张量分解;迁移学习 |
摘要: | 随着城市化中的交通系统压力日益增大,进而产生了交通拥堵、交通事故、环境污染、能源消耗等问题。而智能交通系统的建设作为缓解城市交通系统压力的有效方法,可通过提供实时、准确的交通路况信息来实现。近年来,随着大数据时代的来临,新兴的多样化交通信息获取可以帮助交通系统的建设。然而,丰富的信息也存在结构异质性的问题,不同的交通检测器都存在各自优势与缺陷。如何能够将各种类型的交通检测信息进行优势整合,从而达到交通信息的准确获取以及检测成本的有效控制,是本课题研究的关键问题。以往在交通数据融合领域虽有一定的研究,然而,并没有结合实际城市路网所出现的实际问题来进一步的分析,以及在针对复杂城市路网场景中,目前还没有一套系统方法来估计全时空覆盖的路网环境下交通流量。且针对目前新兴的检测器类型的不断涌现,以往的研究方法不能完全适用于新检测器所出现的问题。因此,目前针对城市路网流量估计的研究仍处于不断探索与更新的阶段。 基于此,本文基于固定检测器与移动检测器针对交通流量获取的特性进行分析,从基于移动检测器的流量估计层面,建立了基于手机定位数据的交通出行方式识别模型与流量估计方法;从城市路网流量的线状缺失层面,建立基于数据融合的张量分解模型来填充缺失流量;并从城市路网流量的面状缺失层面,建立基于融合出租车GPS数据与车牌照片识别数据的迁移学习模型来估计未知路段流量。论文的主要内容可概括为如下几个部分: (1)通过归纳现有的国内外相关文献,针对城市路网交通流量估计的研究中将其按照基于不同数据类型的交通流量估计,基于不同检测器类型的交通流量估计,以及基于不同理论方法的交通流量估计。通过论述与总结,指出了目前的研究存在的不足。首先,针对新兴的交通数据类型仍有较大的应用空间,部分数据所获取的交通信息存在一定的偏差,需要进行合理的筛选与挖掘。其次,针对交通信息缺失问题的研究中缺失场景的分布不够细致,以及较少的融合移动检测器与固定检测器,来进行扬长避短。最后,当前的针对流量估计的研究中,研究方法多集中在单个路段的流量预测方法或整个路网的集中估计方法,缺失针对多样化的流量估计场景的研究方法。 (2)在提出多源数据融合的城市路网流量估计之前,该部分对来自不同交通检测器的数据采集与特性进行分析,将其按照检测器类型的差异,划分为了固定式检测器与移动式检测器,并针对不同检测器数据进行了对比,分析各交通检测器所采集的交通参数信息,以及其各自的优势与劣势。本文从多源数据特性、数据采集原理、交通信息提取方式三方面进行了展开。并针对本文所应用的手机定位数据、出租车GPS数据、车牌照片识别数据,逐一介绍了其数据采集原理,数据分布特性,数据预处理技术等,并阐述了如何将非集计数据转变为所需的集计交通量数据,从而为后面的融合其几种检测器数据来提高流量估计精度提供了可能。 (3)提出基于手机定位数据的交通出行方式识别与流量估计方法。该部分主要针对城市路网中基于手机定位数据来获取各路段交通流研究中,手机用户数并不等于城市路段交通流量。进而,本部分提出了基于最小支撑树聚类算法来进行手机用户的出行方式识别。本部分首先基于本文所使用手机数据的定位精度,研究筛选出将路网中行驶的手机用户数据。并基于各个手机用户的定位轨迹,计算各出行用户的行驶速度,进而筛选出路网中的车载手机用户。并通过基于最小支撑树聚类算法,并根据各手机用户之间的轨迹面积差值,来计算不同手机用户类别之间的类内距离与类间距离,从而以判断手机用户是否同乘一辆车来判断手机用户的出行方法。并基于部分路段中的车牌照片识别流量数据,来进一步验证了不同出行方式的类别。进而,使用线性回归模型进行路段流量的扩样估计。 (4)提出了基于数据融合的线状缺失流量填充模型。该部分主要针对城市路网中出现线状流量缺失的场景,即为检测器出现一段时间内的连续缺失数据时。本部分通过基于手机定位数据的全时空覆盖特性中能够完整描述线状缺失流量趋势的优势,建立了基于数据融合的DFCP张量分解模型。通过融合手机定位数据与车牌照片识别数据来进行车牌照片识别数据中的缺失数据估计。研究通过基于不同天数,时间,路段,以及数据间的相关性,提出了一种四维的张量分解模型。此外,研究为避免城市路网中不同道路等级下交通流量的结构化差异,在所构建的张量模型通过添加正则化惩罚项,来以一种时空权重的形式来刻画张量中不同维度的影响。研究选择南京市路网中实际的车牌照片识别数据的线状缺失流量数据为研究对象,通过设定不同线状缺失长度,不同数据缺失率,以及不同缺失路段类型的条件下,并对比了不同的数据填充方法,来评估本部分所提出的张量填充方法。 (5)提出了基于迁移学习的城市路网面状缺失流量估计模型路段。该部分主要针对城市路网中仅有部分路段安装有固定检测器来获取真实流量,而未布设检测器的路段流量未知。本部分通过建立基于迁移学习的最小二乘支持向量机回归模型,并利用出租车GPS数据与车牌照片识别数据的融合,来进行城市路网中未知路段的交通流量估计研究。其中,本部分首先通过计算出租车速度来确定各路段中的出租车最小样本量,并通过Jensen-Shannon(JS)散度方法,基于出租车速度分布来对已安装LPR检测器路段进行相似性分析,将其划为相似路段集与近乎相似路段集。其次,构建了基于迁移学习的最小二乘支持向量回归模型,基于出租车GPS数据提取出流量特征,并与车牌照片识别数据一起分别在相似路段集与近乎相似路段集中建立训练模型,进而针对目标路段进行流量估计研究。最后,通过实际案例分析,论证了改进后的模型估计性能。 上述研究工作丰富了城市路网中多源交通信息融合理论、交通流量估计技术方法,同时有助于挖掘手机类定位数据在城市交通流量估计中的应用,拓展多源数据融合不同检测器类型下数据组合的优势互补研究;在工程应用方面,论文的开展有助于提高我国智慧城市中精细化交通信息管理手段,以及为今后的检测器布设等工程建设问题中提供了理论指导。 |
作者: | 邢吉平 |
专业: | 交通运输工程 |
导师: | 陈淑燕 |
授予学位: | 博士 |
授予学位单位: | 东南大学 |
学位年度: | 2021 |