论文题名: | 基于Hadoop的卡口数据挖掘技术研究与应用 |
关键词: | 智能交通;数据挖掘;交通流预测;车辆轨迹;聚合分析 |
摘要: | 随着社会的发展,人们生活水平在提高,城市汽车保有量呈现快速增长趋势,一方面它方便了人们的生活,为人们出行带来了便利;另一方面诱发了交通阻塞、交通事故频繁、交通污染等一系列交通问题的发生。目前智能交通系统正是解决这些交通问题关键所在,作为其主要智能设备之一的公路车辆智能监测记录系统(简称卡口系统),在交通管理方面发挥了越来越重要的作用。然而随着卡口系统数量快速增长,导致卡口系统产生的过车记录数迅速膨胀。虽然掌握了大量的卡口数据,但是缺少适当的方法和技术去挖掘这些海量交通数据隐藏的有价值信息。 鉴于此,通过分析城市卡口数据特性以及查阅文献资料,本文以卡口数据为研究对象,借助于目前流行的大数据处理技术Hadoop平台,结合相关数据挖掘算法,对海量卡口数据在“失驾”挖掘和交通流预测方面进行了研究,为缓解目前较严重的交通安全问题和交通拥堵问题有着重要意义。 本文提出的基于海量历史卡口数据的失驾挖掘研究,其主要内容包括嫌疑失驾信息获取、基于时空邻域的车辆轨迹聚合分析和失驾车辆时空轨迹预测,以及进行分布式设计。从而形成了一套对“失驾”违法行为发现、查处的方法。 本文通过分析交通流时空关联特性,给出了基于Hadoop平台的K近邻算法预测时间序列交通流和局部线性嵌入算法估计目标路段相邻上游路段流向系数预测空间交通流模型,通过加权组合,进而确定组合预测模型以提高预测精度和运行效率。 最后,通过真实采集的卡口数据,将本文所研究的两个挖掘应用的分布式算法移植到Hadoop平台上实现,通过测试验证所设计算法的可行性和有效性。 |
作者: | 张云云 |
专业: | 电子与通信工程 |
导师: | 李如春 |
授予学位: | 硕士 |
授予学位单位: | 浙江工业大学 |
学位年度: | 2016 |
正文语种: | 中文 |