论文题名: | 基于MapReduce的LBS空间数据聚类方法研究及应用 |
关键词: | 城市交通;位置服务;空间数据;聚类方法;并行计算 |
摘要: | LBS是基于位置服务的英文简写,近些年来因为定位技术以及互联网的飞速的发展,使之应用领域越来越大,应用成本也越来越低。LBS数据,特别是有关车辆的LBS数据,是对整个城市交通情况的客观描述。通过对LBS数据的聚类分析,可以对整个城市不同区域不同时间段的车流量、行车速度、拥堵情况等信息进行定性以及定量的分析,并且能从不同的角度来描述整个城市的通行特性。 本论文以并行计算框架MapReduce为基础,对海量LBS轨迹数据实现聚类分析,以此识别城市交通的相关特征,并且提出了一种有效的分析超大规模空间数据的方法。 本论文的主要工作如下: 1、论述了LBS数据的组成、结构特征以及国内外目前对LBS应用情况的描述,并且利用Apache Hadoop中的分布式并行计算框架MapReduce实现了对LBS轨迹日志数据的空间聚合。 2、比较和论述了聚类以及空间聚类的异同,并且针对空间聚类的特点,提出了能够同时兼顾空间关系和属性信息的一种空间关系的概念化以及应用的模型。 3、实现了对超过TB级的海量点状数据进行聚类,在论文中提出了一种采用分布式集群计算实现数据聚合,并且提取相应空间区域的统计特征量的方法,将大量的离散的点数据聚合成带有相应特征的结构化网格数据。最后通过面状空间聚类的方式实现聚类,以此识别城市交通情况的特征。 4、设计并且编码实现了针对海量LBS点数据分析交通情况的应用软件,并且在实际工作得到了检验。 |
作者: | 卢萌 |
专业: | 计算机技术 |
导师: | 耿志强 |
授予学位: | 硕士 |
授予学位单位: | 北京化工大学 |
学位年度: | 2016 |
正文语种: | 中文 |