当前位置: 首页> 学位论文 >详情
原文传递 基于大数据的交通领域本体构建方法研究及实现
论文题名: 基于大数据的交通领域本体构建方法研究及实现
关键词: 交通领域;本体构建;大数据;K-means聚类;相关度判断
摘要: 随着中国社会经济和互联网技术的快速发展,交通行业信息化建设不断深入,交通领域产生了海量的数据,这些数据被以多样的形式存储在不同的数据中心中,具有异构、海量、难以重用等特点。虽然交通运输部强制推行了《交通信息基础数据元》用以统一数据结构,但是这些数据间仍然存在着大量交叉,导致了数据定义重复、数据元量大等问题。而本体自从被引入到知识工程领域以来,在知识组织、共享和重用等方面发挥了重要的作用。本文将本体技术和数据元相结合,提出适合交通领域的本体模型,并研究利用海量的交通数据构建交通领域本体的方法,主要内容包括:
  第一,对交通信息基础数据元的结构、类别和本体的组织形式、构建方法等进行了探讨,分析交通信息基础数据元和本体模型的特点以及二者之间的对应相似之处,在此基础上提出了基于文本大数据的交通领域本体层次模型。
  第二,对交通领域本体层次模型每一层的构建方法进行了研究。首先,根据《交通信息基础数据元》构建了交通信息基础数据元本体,完成了基于数据元的共用本体层的构建,对交通本体层次划分给出了框架并对公路领域子本体框架进行了详细描述;其次,通过基于交通行业词典的中文文本分词、基于隐马尔可夫模型的术语提取和相关度判断等方法的研究和实验,从交通文本大数据中提取出构建本体所需的概念和关系等,然后通过K-means聚类和人工清洗数据的方法进行了数据优化从而完成了元数据层的构建;最后,将数据元本体看作“源”,通过知识工程的方法不断从元数据层获得概念,实现子领域本体层的构建。
  第三,设计和实现了交通领域本体层次模型原型系统,并通过对比实验对本体模型进行了验证。
  本文对交通领域本体的构建实现了半自动化的方式,为克服交通信息基础数据元的不足,构建符合交通行业特点的领域本体提供了一种可行的方法。
作者: 田昊
专业: 计算机技术
导师: 张绍阳
授予学位: 硕士
授予学位单位: 长安大学
学位年度: 2017
正文语种: 中文
检索历史
应用推荐