当前位置: 首页> 学位论文 >详情
原文传递 基于Hadoop的新型公交支付系统的客流量预测研究
论文题名: 基于Hadoop的新型公交支付系统的客流量预测研究
关键词: 公交支付系统;客流量预测;分布式架构;并行化处理;BP神经网络;粒子群算法
摘要: 城市公交作为市民日常出行的主要交通工具,是市民最关心、最直接、最现实的生活问题之一。不断提高公共交通运营质量、完善公共交通运营服务,可以有效缓解交通拥堵矛盾,满足市民群众出行需求。城市公交管理部门的合理运营、智能化调度对提升公共交通服务有很大帮助。而公交客流数据是预测未来某个时间段客流变化,实现合理运营、智能化调度的关键性数据;同时客流量预测也是智能交通系统的一个重要研究方向。
  随着城市规模扩大、城市人口数量上升,以及互联网技术的快速发展,“大数据”的时代已经到来;公交客流预测的研究变得更复杂,要求也更高。要实现精准的客流预测需要两个关键的因素:完整的客流数据与性能优越的预测算法。而通过以往客流数据获取方法得到的数据存在信息量小、不够完整、难整理等缺点;并且由于传统的预测模型有着自身的缺陷,所以针对目前客流数据量大、变化复杂的现状,其已不能满足预测要求。因此有必要寻找更好的方法,去提升客流预测的准确度。
  本课题以实际科研项目为依托,首先对公交支付系统发展现状以及Hadoop平台下客流预测研究现状进行了分析,确定了研究方向;分析了新型公交支付系统相关技术,该系统提供的客流数据具有完整,准确,全面等特点,为客流预测提供了有力支撑;同时设计了基于Hadoop分布式处理平台的客流量预测研究的总体方案。
  利用现场调研的结果,本文对影响客流量变化的因素进行了详细分析,从量化的角度明确了预测客流应考虑的主要影响因素。研究并选定了客流数据的预处理方法,同时分析比较了几种常用的客流预测算法,其中误差反向传播的BP神经网络对于解决复杂的随机非线性映射问题具有良好的效果,但是存在训练时间长、泛化能力差、易陷入极小值等缺点;针对以上问题,本文将Hadoop并行化处理技术引入到客流预测中,先使用粒子群(PSO)对BP算法的权、阈值进行优化,再利用并行化编程模型(MapReduce)对优化后的算法进行并行化设计,进而完成整体算法的改进。
  最后,对数据处理平台进行结构设计,完成了Hadoop分布式处理平台的搭建。在该处理平台下,利用预处理后的客流样本数据,对改进的并行化PSO-BP算法进行测试,统计实验数据并分析其性能。测试结果表明,本文所提的改进算法的收敛速度和预测精度均明显优于原算法,同时在大数据集上的训练速度也明显高于原算法。
作者: 杨立
专业: 控制科学与工程
导师: 闫保中
授予学位: 硕士
授予学位单位: 哈尔滨工程大学
学位年度: 2017
正文语种: 中文
检索历史
应用推荐