论文题名: | 基于时空约束的城市热点区域与热点路径挖掘 |
关键词: | 城市交通;热点区域;路径挖掘;时空约束;聚类算法 |
摘要: | 轨迹是移动对象的空间位置随时间连续变化而形成的印迹。近年来,随着物联网和移动计算技术的发展,全球定位系统(Global Positioning System,简称GPS)以及其他形式的位置获取技术给了人们前所未有的机会去收集移动对象的轨迹数据,大量的轨迹数据不仅展现了不同对象的移动信息,更重要的是通过对这些轨迹数据进行分析和挖掘可以发现轨迹数据中潜在的模式和知识,从而将其更好地服务于人们的日常生活。特别地,从大规模的出租车轨迹数据中发现有价值的信息吸引了研究者广泛的关注。 出租车作为一种重要的交通工具在人们的日常出行中扮演了重要的角色,区别于公交车和轨道交通等其他出行方式,出租车没有固定的线路和站点,致力于提供快速、便捷、定制化的个人出行服务,因此,其行驶过程中的轨迹信息能够很好的反映人们的出行特点以及城市交通的运行状况,是城市交通分析重要的数据来源。其中,有两个方面的研究对交通管理和城市规划有着重要参考的意义。一方面,通过提取出租车轨迹数据中的载客点和卸客点并对其进行聚类分析,可以发现城市中的热点出行区域,这些热点区域反映了人们出行的行为模式以及城市中乘车需求的区域分布,对于出租车的调度分配以及公交线路的规划具有积极作用;另一方面,通过对热点区域间的轨迹数据进行轨迹聚类分析,可以将具有时空相似性的轨迹汇聚成轨迹簇,这些轨迹簇直接体现了车辆在行驶过程中的热点路径以及运动规律,对于交通治理和移动模式挖掘有着重要价值。 本文以重庆市10000辆安装有GPS设备的出租车为研究对象,针对城市中的出行热点区域和热点路径展开研究,首先,本文建立了一套轨迹数据预处理方法,利用该方法对出租车轨迹数据进行数据清洗和数据准备;其次,本文针对现有热点区域挖掘方法存在的不足做了改进,提出了一种基于网格密度的聚类算法挖掘城市中不同时段的热点出行区域;最后,为了进一步对热点区域之间的热点路径展开研究,本文提出了基于时空相似性的轨迹聚类算法,该方法综合考虑了轨迹数据的时空特性,能够有效地识别城市中的热点出行路径。本文的主要研究内容可以概括为以下几个方面: (1)本文针对出租车轨迹数据的时空特性,建立了一套完整的轨迹数据预处理方法,该方法包括:数据降维,剔除噪声数据,清理重复数据,提取载客点/卸客点数据,GPS数据校准,以及轨迹压缩。实验表明,该方法能够提取轨迹数据中的有效数据,提高数据的准确性。 (2)本文针对现有热点区域挖掘方法在面对大规模轨迹数据时存在的伸缩性差、计算效率低等问题,提出一种基于网格密度的 GScan聚类算法。该算法首先将轨迹空间划分成网格单元,并设定网格单元的密度阈值;然后将轨迹点映射到网格单元,基于密度阈值提取热点网格单元;最后通过合并可达热点网格单元发现城市的热点区域。以重庆市出租车轨迹载客/卸客点数据进行实例分析,给出了网格单元大小和密度阈值两个参数的设定方法,进而获取重庆市主城区居民出租车出行热点区域的时空分布,分析重庆市居民出行行为。 (3)在热点区域挖掘结果的基础之上,本文研究了一种基于时空相似性的ST-TCLUS轨迹聚类算法,并将其用于热点区域之间热点路径的提取。针对现有的轨迹聚类算法在聚类时只考虑空间相似性的不足,本文研究并提出了一种基于时空相似性的轨迹聚类算法,该方法在对轨迹空间相似性进行改进的同时考虑了时间相似性对聚类结果的影响,实验结果表明,由于具体化了轨迹在时空范围内的聚集分布,因此其计算得到的结果相比其他的空间轨迹聚类方法更具代表性。 |
作者: | 赵欣 |
专业: | 计算机科学与技术 |
导师: | 刘卫宁 |
授予学位: | 硕士 |
授予学位单位: | 重庆大学 |
学位年度: | 2017 |
正文语种: | 中文 |