论文题名: | 大数据环境下基于共性交通态势寻觅短时流量预测研究 |
关键词: | 智能交通;短时流量;预测算法;融合距离 |
摘要: | 利用交通大数据进行短时流量预测成为智能交通研究的重要课题之一。2016年7月,国家发改委、交通运输部印发《推进“互联网+”便捷交通促进智能交通发展的实施方案》,提出建设先进感知监测系统、构建下一代交通信息基础网络、强化交通运输信息开放共享等具体要求。大数据结合交通被认为是缓解交通拥堵,减少交通事故、提高通行效率的有效手段。短时交通流量预测是智能交通控制的核心部分,是精细化交通控制、有效的交通诱导,精准的信息服务的前提支撑。关于交通流短时流量预测研究已有较长的历史,随着时代的发展、技术的进步研究方法也在不断更新换代。以往预测方法多以纯数学模型推算为主,多通过数理统计模型进行数学推断,对交通态势演变的规律和外在因素与交通流影响的研究还有待进一步探索。本文提出基于共性交通态势寻觅短时流量预测模型。所谓共性交通态势寻觅预测,指在大数据环境下通过寻找历史相似交通态势预测未来的流量的方法。文章在交通大数据的基础上研究了交通中的共性交通态势现象,以此为基础构建了基于向量间距融合及相似性判别短时流量预测算法体系;利用层次聚类法构建历史交通态势数据库;结合欧式距离和余弦距离创新提出的融合距离计算方法;探寻了模型中关键参数对预测效果的影响,并给出了参数建议取值。具体研究内容如下: (1)数据处理和分析。对来自多路段RFID、视频卡口流量数据结构化的原始数据进行了分析和处理。原始采集数据中存在较多的问题数据,研究了对应各种数据问题的处理方法,并给出了实际数据的处理效果。 (2)交通态势特性研究。对在各种交通条件下的特征交通态势进行分析,探究外部因素对交通流的影响,及交通流呈现的特征。分析探讨了从海量数据中挖掘具有相似变化态势的数据来进行短时流量预测的可行性,并提出了相应的短时流量预测算法思路。 (3)断面数据库聚类研究。丰富的交通态势是预测关键,理想的数据库应包含各种影响因素下的交通态势和典型规律,但冗余的数据义会导致计算量增大,增加搜索时间。通过层次聚类法将多断面进行分类,类似断面数据合并,相异断面数据分离。保证典型数据的丰富性,减少收索时间。 (4)融合距离研究。KNN的基础算法中以欧式距离作为判别样本相似度的依据,但在交通流序列中,该判别方式只能衡量序列的“靠近性”和“相似性”。融合距离结合欧式距离和余弦距离两者的优势,能够更好的找出历史中相似的交通流序列。 (5)最优参数取值研究。窗口长度M与最邻近K的个数是该算法仅有的两个预设参数,对寻找最优共性态势交通流减少预测误差至关重要。K决定了选择多少个历史交通日预测未来流量,M值决定了选择多长时间的当前观测量进行匹配。通过交叉验证法,验证了两个参数在种不同的组合下的预测效果,获得了预测结果随参数取值的变化而变化的曲线,选取了最优参数。 (6)预测实验。以某城市快速路为预测对象,对比了共性交通态势寻觅模型与经典KNN算法和ARIMA算法。从预测结果上看,该算法预测精度优于经典KNN算法和ARIMA模型1-4个百分点,工作日和非工作日MAPE均在10%左右,最优低至9.2%。实验证明本算法精度高、适应性强具有较强的稳定性。 |
作者: | 谭宇婷 |
专业: | 交通运输;交通信息工程信息及控制 |
导师: | 蔡晓禹 |
授予学位: | 硕士 |
授予学位单位: | 重庆交通大学 |
学位年度: | 2018 |
正文语种: | 中文 |