当前位置: 首页> 学位论文 >详情
原文传递 融合社交网络数据的特殊事件下轨道站点客流预测模型研究
论文题名: 融合社交网络数据的特殊事件下轨道站点客流预测模型研究
关键词: 城市轨道交通;特殊事件;客流预测;社交网络;集成学习
摘要: 伴随我国城市化进程的深入推进,城市交通面临道路拥堵及运输效率不高等系列问题。城市轨道交通作为新基建焦点领域,凭借高效便捷、安全可靠、环保节能等诸多优势,成为支撑城市公共交通系统发展的主导力量。以文艺活动、体育赛事为代表的特殊事件的举办极易引发轨道交通站点空间内大规模人群集散,加剧短时轨道交通客流骤增滞积,显著影响活动场馆周边轨道交通站点出行需求规律,诱发客流对冲甚至踩踏拥塞等运营安全问题。明确特殊事件期间轨道交通客流时空影响范围并精准把控事件客流需求,是部署运力计划和制定管制策略的必要前提,对于保障特殊事件期间轨道交通系统运行效率和运营安全,提升客运服务质量具有重要意义。
  目前城市轨道交通短时客流预测主要以常态条件为背景,但其与特殊事件背景下的客流需求特征差异显著。针对特殊事件下的城市轨道交通客流预测问题,本文基于轨道交通历史客流规律解析,引入用以反映潜在出行者心理和行为的社交网络数据作为非交通数据集,开展特殊事件下城市轨道交通进出站客流预测研究。本文主要研究内容及结论如下:
  1、特殊事件下轨道交通客流演化规律解析。界定特殊事件概念、特性及分类,梳理特殊事件下轨道交通客流概念及客流描述指标。采用数理统计方法,定量描述特殊事件下轨道交通客流分布特征,明确特殊事件期间站点客流变化过程及影响范围,探讨其与常态客流的分布差异。总结轨道交通客流变化特性,从时间、空间及外部因素维度归纳特殊事件下轨道交通客流影响因素。
  2、社交网络数据与轨道交通客流关联性验证。分析梳理当前社交网络数据采集方法,基于用户行为分析,从静态属性及动态行为层面解析社交网络内容构成,设计基于 Scrapy网络爬虫框架的社交网络数据采集规则。开展冗余数据清除、文本分词去停等文本预处理,运用潜在狄利克雷分布(Latent Dirichlet Allocation, LDA)模型和自然语言情感分析方法,从主题属性和情感属性角度挖掘文本数据语义特征。以发文频率与情感分值表征社交网络数据内容,并描述指标时间分布特征,结合相关系数定量分析社交网络数据与轨道交通站点客流间关联关系。
  3、基于集成学习理论的进出站客流预测模型构建。从常态特征及活动特征角度构建特殊事件下轨道交通客流影响因素集,阐述指标选取依据与构建方法。基于特殊事件下城市轨道交通客流预测难点分析,从解决思路和解决方法角度提出基于集成学习思想的短时客流预测框架,选取极端梯度提升模型(eXtreme Gradient Boosting, XGBoost)、随机森林模型(Random Forest, RF)、K 近邻模型(K-Nearest Neighbor, KNN)为基学习器,线性回归模型为元学习器,设计适用于特殊事件下轨道客流预测的堆叠(Stacking)集成学习模型,确定用于支撑模型超参数选取及效能评估的交叉验证方法和评价指标。
  4、实证研究与结果分析。为验证本文构建特征及模型有效性,以重庆轨道交通特殊事件下的站点客流为例开展实证研究,分别将不含社交网络数据的特征集合与全特征集合作为模型输入,对比不同特征集下基模型的预测结果。使用Stacking 集成学习模型求解轨道交通进站及出站客流,对比基模型与其它常用客流预测模型的预测精度。预测结果表明,社交网络数据的融入可普遍提升单模型预测精度,以全特征集合为输入的 15分钟进出站客流平均预测精度提升超 4%;集成学习模型进站及出站客流预测误差率分别为 8.55%与 9.64%,预测准确率相较 XGBoost、RF 及 KNN 模型最高提升近 3.5%,最低提升近 0.7%,验证了Stacking集成学习模型对特殊事件下进出站客流的预测准确性。
作者: 王才雪
专业: 交通运输工程;交通运输规划与管理
导师: 陈坚
授予学位: 硕士
授予学位单位: 重庆交通大学
学位年度: 2023
检索历史
应用推荐