当前位置: 首页> 学位论文 >详情
原文传递 基于多源数据融合的城市道路拥堵相关性研究
论文题名: 基于多源数据融合的城市道路拥堵相关性研究
关键词: 交通拥堵;智能交通系统;多源交通数据;模型融合
摘要: 过去10多年间,国内各大城市的交通拥堵问题愈演愈烈,已经成为人民群众和政府部门关注的焦点。智能交通系统(ITS)的应用有助于缓解道路拥堵程度。目前的研究工作主要集中基于交通传感器收集的数据实时估计和预测交通流的变化情况,从而帮助交通部门进行疏堵决策。道路拥堵相关性分析是其中重要的应用之一,它通过估计城市路网中道路拥堵在时间和空间上关联程度,从而帮助交通管理部门合理分配警力、提高道路资源分配能力,有效缓解交通拥堵。
  为提高大规模城市路网中道路拥堵相关性估计的准确性,本文首先提出了一种基于多源交通数据分析的拥堵相关性估计框架,数据源包括了道路数据、POI数据以及GPS数据。它根据路网、车辆和地理兴趣点(POI)等交通信息提取出二十多种特征来计算不同路段、不同时刻拥堵发生的相互关系,尝试了随机森林、SVM、决策树和逻辑回归等四种分类器;为消除离群值对估计准确性的影响,提出了多统计指标的离群值剔除方法(MIZ),它融合了中位数绝对偏差(MAD)、四分位距(IQR)和标准分数(Z-score)3种统计量,提高了离群值识别的鲁棒性;为了解决训练数据不平衡问题,本文采用模型集成的思想,融合了梯度提升决策树(GBDT)、分布式梯度增强模型(XGBoost)和自适应增强(AdaBoost)等分类模型,缓解数据不均衡的影响,提升模型召回率。
  实验采用的数据来源于浙江省台州市某区8-9月间的出租车GPS数据,用于估计每5分钟的道路通行速度和拥堵程度。GPS数据采样频率小于2分钟,共有170万条数据,范围覆盖375条城市主要路段。POI数据采用爬虫技术从交通地图网站上爬取,共12978条。基于多源交通数据的框架精确率为84.9%,基本满足工业化应用的要求;提出的多统计指标的异常值剔除方法,使得精确率提高了3.6%,消除了部分异常值影响;在训练数据不平衡的情况下,融合模型使得召回率提高了8.6%。实验结果表明,本文提出的方法在一定程度上提高了大规模城市路网中道路拥堵相关性估计的准确性。
作者: 万晓龙
专业: 计算机应用技术
导师: 单振宇
授予学位: 硕士
授予学位单位: 杭州师范大学
学位年度: 2021
检索历史
应用推荐