论文题名: | 水上位置大数据索引方法的研究 |
关键词: | 航运系统;水上位置;大数据;空间索引 |
摘要: | 信息技术的发展,特别是物联网技术的发展促进了各种定位技术的普及。随着时间的推移,各种设备位置数据的种类和数量都呈爆炸性的增长。在航运系统中,以传统电子海图为基础的航运平台难以满足新应用的数据处理需求。大数据时代的到来,为处理和分析这些海量和复杂的信息提供新的思路和方法。空间数据索引可以为海量的水上位置数据提供高速的存储、查询和检索的方法。本文将水上位置数据服务平台和空间数据的索引技术相结合,研究水上位置大数据的高速索引方法。 本文结合水上位置数据的特点,提出了线索四叉树的概念,并设计出相应的索引算法,应用到水上位置数据检索原型系统中。线索四叉树为每个四叉树节点增加一个线索链,指向其所有子节点的对象。根据四叉树的性质,查询时若发现查询范围能够完全覆盖某个节点,则直接从线索链中取出对象,不需要进一步对其递归检索。具体做法是对空间区域的比较操作进行细化,将比较操作的计算结果分为分离、包含和相交。这种处理方式能有效地减少四叉树查询数据的代价(比较次数和迭代次数),提高了查询效率。在具体的应用系统中,可以通过对节点添加一个返回所有子节点数据的功能(而不必建立实际对象线索链),来减少线索四叉树的空间代价。 提出了一个四叉树编码算法,并将算法应用于水上位置数据服务系统中,提高了位置数据的查询效率。四叉树编码算法是基于空间分割的思想,将水上位置数据整体空间范围按照四叉树的方法四等分,分成四个子空间,每个子空间按照同样方法四等分,从而形成了一系列层次分割的子空间,这些子空间按照特定的顺序进行编码。利用四叉树的运算规律,建立一个快速计算子空间所属节点的父节点或子节点的算法。在查询数据时,使用这个编码算法能够快速找到相应的四叉树节点,不需要对四叉树进行递归遍历。对于每个查询操作,都可以使用快速算法直接找到相应的四叉树节点。算法的时间代价是相对固定的,不会随数据规模的增大而显著增大。 提出了缓冲四叉树的数据索引结构,这种索引既可以用于水上位置信息服务系统的移动数据终端上,也能用于水上位置大数据的机群处理系统中。在应用端建立一个服务器端节点的缓冲镜像,用户执行查询操作时,应用端首先在缓冲镜像查询数据。通过特定的算法,找出缓冲区中符合条件的数据,同时也计算出缓冲区没有数据的空白区域,将这些空白区域发送给服务器,再由服务器在完整的数据集上执行查询操作。一般情况下,这些空白区域要小于原始查询区域。缓冲四叉树给服务器和应用终端上的四叉树索引节点建立统一的节点编码,这种编码可实现四叉树节点的快速定位,服务器和应用终端之间利用这个快速定位方法可以实现数据和操作的快速同步。 |
作者: | 张忠杰 |
专业: | 交通信息工程及控制 |
导师: | 赵德鹏 |
授予学位: | 博士 |
授予学位单位: | 大连海事大学 |
学位年度: | 2015 |
正文语种: | 中文 |