论文题名: | 基于Spark的改进SA-SVR短时交通预测研究 |
关键词: | 交通预测;SA-SVR模型;支持向量回归机;模拟退火算法;参数优化;Spark平台 |
摘要: | 科技的快速发展为人们的生活带来了便捷,但同时也带来了一些负面影响。交通事故、道路拥堵、以及车辆尾气排放带来的全球变暖等,这些交通问题作为经济发展的负面附属品,是众多问题中急需解决的一个。自交通问题出现之时,对于交通问题的解决方案的研究从未停步,随着智能时代的到来,智能交通系统的概念被提了出来。智能交通系统作为目前解决交通问题的首选,而短时交通流作为智能交通系统的一部分更是得到了研究人员的重视。但是交通流并非是一成不变的,它是一个非平稳的易受外界环境干扰的非线性系统,并且拥有海量的交通流数据,随着时间的推移这些数据也在不断的增长。如何处理这些海量的数据并达到交通流预测的精确性和实时性要求成为近年来的主要研究方向。 本文从研究提高短时交通流预测的准确性和实时性出发,主要研究内容包括: (1)研究了适用于处理小样本非线性的支持向量回归机(SVR)。在已有的基础上,对交通流和交通流的数据特点进行研究,基于交通流和交通流数据的特点研究了比较实用的短时交通流预测模型,经过研究对比和实验,验证SVR作为短时交通流预测的可行性和实用性。 (2)改进了适用于处理大型组合优化的模拟退火算法(SA),将其应用于支持向量回归机进行参数优化。在选择支持向量回归机的基础上,对支持向量回归机的研究发现支持向量机的参数对于整个模型的预测结果有着至关重要的作用,为了达到建立基于最优参数的短时交通流预测模型,本文研究对比其他传统参数优化算法,确立并改进了适用于处理大型组合优化的模拟退火算法,基于改进后的模拟退火算法对支持向量回归机进行参数优化,并基于最优参数建立了预测模型,解决了短时交通流预测中的预测准确性问题。 (3)建立了Spark平台下的SA-SVR预测模型。随着交通流数据量的增加,在处理海量的交通流数据的过程中,单机模式下的预测模型由于物理因素的限制无法满足短时交通流预测对于预测实时性的要求,为了解决预测时间的问题,本文在大数据时代的背景下研究对比选择具有分布式并行处理能力的Spark技术对支持向量回归机做大规模的并行算法训练,并结合了支持向量回归机处理非线性小样本事件的特性和Spark的并行处理时间短的优点,建立了Spark平台下的SA-SVR预测模型。实验证明,此模型在保证了预测精度的前提下缩短了预测的时间,同时满足了短时交通流预测对于精确性和实时性的要求。 本文基于预测模型进行了三组对比实验,分别是RBF神经网络与支持向量回归机模型、网格算法与模拟退火算法及改进后的模拟退火算法参数优化模型、单机模式下与Spark并行模式下的预测模型实验对比。这三组对比实验结果证明了基于改进的模拟退火算法对支持向量回归机进行参数优化后的模型在Spark环境下比传统的算法及单机模式下的预测更具有竞争力,Spark平台下的该模型在预测过程中不仅解决了短时交通流预测的精确性问题,也解决了短时交通流预测中的预测效率问题,总体提高短时交通流预测中处理交通流数据的能力及预测的精确性和实时性。 本文的主要创新点是将支持向量回归机的稀疏性特点与分布式集群Spark系统的并行处理能力相结合,在Spark平台下进行大规模SVR训练,由此建立了Spark平台下的SA-SVR短时交通流预测模型,该模型很好地解决了短时交通流预测的精确性和实时性问题。 |
作者: | 刘彩云 |
专业: | 计算机技术 |
导师: | 刘志锋 |
授予学位: | 硕士 |
授予学位单位: | 东华理工大学 |
学位年度: | 2017 |
正文语种: | 中文 |