当前位置: 首页> 学位论文 >详情
原文传递 基于大数据Spark架构的铁路货物在途时间预测并行计算设计与实现
论文题名: 基于大数据Spark架构的铁路货物在途时间预测并行计算设计与实现
关键词: 铁路货物运输;在途时间预测;并行计算;Agent技术;大数据分析
摘要: 铁路货物运到期限是评价铁路运输方式在市场中是否具有竞争力的一个重要指标,科学地估计运到期限对于提高铁路货物运输服务质量,扩大铁路运输量,提升铁路货物运输在运输市场中的竞争力具有重要的意义。铁路货物在途时间指的是铁路运输作业中完成装车作业的货物从始发站发车开始至到达终点站的时间,是货物运到期限的重要组成部分。受铁路运输过程中作业流程多,作业时间和车流径路不确定等诸多因素的影响,铁路实际生产中很难做到对货物在途时间进行实时准确的预估,预测结果的准度和精度一般较低,直接影响了铁路货物运到期限的预测精度,大大制约了铁路货物运输的市场竞争力。
  本文以实现铁路货物在途时间的精确预测为目标,首先分析了国内外关于货物在途时间预测的研究现状,指出了现有的铁路货物在途时间计算方法存在的问题和不足,并结合铁路货物运输作业过程,着重对铁路货物在途时间预测的难点进行了分析。
  其次,借助铁路运输信息集成平台中积累的海量历史报文数据和大量新增的实时数据,应用Agent技术,从数据处理和时间预测两个方面构建了货物在途时间预测Agent;基于OD站点间的货物在途时间历史数据集合的正态性,应用正态分布理论,构建了基于Agent的货物在途时间预测模型,设计了货物在途时间预测算法,实现了任意OD站点之间的货物在途时间的实时动态预测,并设计了一个实例对模型和算法的有效性进行了验证。
  接着,针对提出的预测模型和算法求解时涉及的数据量大,计算难度高等特点,论文应用大数据Spark架构对构建的模型进行了并行计算设计和实现,设定了Spark架构的并行机制,重点对铁路货物在途时间预测任务的总体模块和五大基本模块的并行计算架构进行了设计和实现。
  最后,构建了服务于铁路货物在途时间预测的大数据平台,采用面向对象的编程语言(Java)和结构化的系统开发方法,设计并开发了一个用于铁路货物在途时间动态预测的原型系统,并进行了多次实验,验证了预测模型和算法的有效性以及预测指标的实用性。
作者: 程炎敏
专业: 电子商务
导师: 董宝田
授予学位: 硕士
授予学位单位: 北京交通大学
学位年度: 2018
正文语种: 中文
检索历史
应用推荐