当前位置: 首页> 学位论文 >详情
原文传递 面向大规模车辆轨迹序列数据的检索方法研究
论文题名: 面向大规模车辆轨迹序列数据的检索方法研究
关键词: 智能交通;大规模车辆轨迹序列数据;检索方法
摘要: 随着智能设备和全球定位技术在交通领域的广泛应用,大规模的轨迹序列数据被采集、传输和存储。在快速发展的云计算和大数据分析技术的推动下,对大规模交通轨迹数据进行高效的分析和研究,进而为交通参与者提供实时有效的个性化出行服务已经成为智能交通领域的迫切需求之一。时空轨迹数据是指在一定的时空范围内对移动对象连续移动位置进行周期性采样而得到的时空序列数据。时空轨迹数据在智能交通领域的很多重要问题中有着重要的研究价值,例如在时空轨迹数据驱动下的交通状态预测预与评估、移动对象位置预测与个性化信息服务、居民的出行特征及模式评估与城市交通布局优化等,其中,对大规模时空轨迹数据的检索操作是在上述时空轨迹数据的分析处理过程中的一个普遍的重要环节。然而,随着时空轨迹数据规模的急剧增长,传统数据库提供的通用检索机制对时空数据的检索效率仍存在不足,如何结合轨迹数据的时空特征提供更加高效的检索机制已经成为大规模时空轨迹数据分析领域的一个亟待解决的关键问题。
  本文结合轨迹的时空特征提出了一种面向大规模轨迹序列的检索方法,包括轨迹序列多级索引机制、基于多级索引的轨迹序列查询方法和轨迹序列排序方法。相比于已有方法,本文所提的面向大规模轨迹序列的多级索引机制在降低了索引的存储开销的同时进一步提高了轨迹序列的查询效率。同时,本文所提的方法中提供了多种轨迹序列查询方式可以满足多样化的轨迹查询需求。针对轨迹序列查询的特点,本文进一步提出了一种基于频繁序列模式的轨迹序列排序方法,从而更高效的为用户提供轨迹序列查询结果,改善用户对轨迹序列检索的使用体验。本文的具体研究工作如下:
  (1)实现了针对原始轨迹数据的预处理方法。首先对原始轨迹数据进行数据清洗以去除异常点和重复数据,并对原始轨迹数据进行地图匹配以获得校正的轨迹数据;然后,结合出租车轨迹数据的特点对轨迹数据进行了分段从而得到校正的轨迹序列数据;最后,对轨迹序列数据进行数据压缩以及轨迹序列id生成以方便后续进行轨迹索引。
  (2)针对分段后的校正的轨迹序列数据,本文提出了一种分布式的三级轨迹索引结构,并设计了相应的轨迹索引生成、更新、持久化方法,该轨迹索引相比于传统的方法有效提高了索引的生成、更新效率,并节省了存储开销。
  (3)为了满足多样的查询需求,针对精确查询、点查询、范围查询、相似轨迹查询,基于提出的轨迹索引提出了对应的轨迹查询方法,相比于传统方法有效提升了轨迹查询的效率。
  (4)在轨迹模糊查询的情形下会返回大量的查询结果,用户无法快速有效地从查询结果中获取所需的轨迹信息。针对这一问题,本文提出了一种基于频繁轨迹序列模式的查询结果轨迹集排序方法,该方法相比于传统的基于单一维度的轨迹排序方法能够将富含司机驾驶经验的轨迹序列排到前面,在行程时间、轨迹长度、平均速度、可信度和稳定性方面更具有优势,能够更加有效为用户提供其所需的轨迹信息。
作者: 何昊健
专业: 计算机科学与技术
导师: 康军
授予学位: 硕士
授予学位单位: 长安大学
学位年度: 2022
检索历史
应用推荐