论文题名: | 基于出租车GPS数据的居民出行分析 |
关键词: | 出租车;GPS数据;居民出行;Hadoop平台;数据挖掘 |
摘要: | 居民作为城市活动的重要参与者,居民的出行活动对城市的交通规划、基础设施建设等具有重要影响,因此对居民出行行为的分析也变的越来越重要。出租车作为城市交通系统的重要组成部分,其运营特性具有随机性、即走即停、覆盖范围广的特点,行驶的起止点由乘客决定,运营规律能够很好的反应居民的出行特点。同时装有GPS定位设备的出租车能够很好的记录出租车的运行状态,描绘出租车的运行轨迹。通过对出租车GPS数据的分析挖掘可以分析居民的出行特征,为城市规划建设提供参考。同时随着信息采集技术的提高,城市交通数据的采集量呈现出爆炸性增长,面对如此大量的数据传统处理方法已无法满足。Hadoop作为一种被广泛认可的大数据处理平台,其以HDFS和MapReduce为核心,在大数据存储与计算方面有着独特优势。 本文基于Hadoop平台对出租车GPS数据进行分析研究,通过Hadoop平台对GPS数据进行存储与处理,使用R语言对数据进行分析挖掘及可视化。首先,搭建高可用性Hadoop平台,保证平台的稳定性。通过Hive对存储HDFS上的GPS原始数据建立数据仓库,根据分析要求对原始数据进行清洗与筛选,对不同需求数据进行分类存储;其次,对预处理后的出租车GPS数据,从时间上(日出行量、出行时间、载客率)和空间上(出行距离、出行热点)对居民出行的特征进行统计分析,对比工作日与休息日的居民出行数据,并通过R语言及地图匹配实现数据的可视化展现;最后,对出租车GPS数据进行更深层次的数据挖掘,首先对地理空间进行网格划分,分别统计每个网格的上下客总量数据,对相应网格合并,再通过聚类分析找出在相同时间不同区域具有相似特性的区域进行统计,挖掘出潜在的商圈信息。 |
作者: | 刘敬帅 |
专业: | 计算机应用技术 |
导师: | 朱昶胜 |
授予学位: | 硕士 |
授予学位单位: | 兰州理工大学 |
学位年度: | 2017 |
正文语种: | 中文 |