当前位置: 首页> 学位论文 >详情
原文传递 基于本体的船舶领域知识获取研究
论文题名: 基于本体的船舶领域知识获取研究
关键词: 船舶领域;知识获取;知识库构建;知识表示;语义相似度算法
摘要: 知识获取作为知识库构建中的三大关键技术之一,同时也是知识库构建的瓶颈问题,其技术的优劣直接影响着知识库的推广与应用。传统的知识获取大多靠手动完成,效率低下,已无法满足当前对海量信息处理的要求,所以自动或半自动地进行知识获取是目前知识工程领域里的一个研究热点。此外,如何进行知识的表示,以提高知识的利用效率是知识库构建过程中的另一关键问题。本体知识表示法是当前最为流行的一种知识表示方法,即将知识表示成本体的形式,这可以提高知识的明确性,减少在知识获取中的分析代价。
   本文在研究了现有的知识获取方法的基础上,面向船舶领域,将本体理论与知识获取理论相结合,提出了基于本体的船舶领域知识获取框架,该框架中包含了4个基本模块:船舶种子本体引入、文本预处理、船舶知识获取和船舶本体完善。船舶种子本体引入模块的任务是从《交通汉语主题词表》和《中国分类主题词表》这两个主题词表中提取出船舶领域的核心概念及关系,并构建一个船舶种子本体;文本预处理模块主要是对抓取的船舶领域中文网页进行解析、中文分词等处理,进而生成概念词集;船舶知识获取模块主要完成种子本体的解析、概念匹配和本体编辑工作,在概念匹配子模块中引入了基于知网的语义相似度算法,并对其中的义原相似度算法做了改进;船舶本体完善模块的任务是对扩充后的种子本体进行简单推理和评价,使获得的船舶本体知识更加科学合理。最后,设计并实现了基于本体的船舶领域知识获取原型系统,并通过实验验证了其技术可行性。
   本文用本体表示船舶领域知识进而实现知识的半自动获取,该方法增强了知识的语义性,提高了知识获取的自动化程度,加快了领域知识获取的进程,解决了传统的领域知识获取过程中过分依赖领域专家的问题。同时也为本体领域知识的获取提供了一种可选且有效的方法。
作者: 张元发
专业: 计算机科学与技术(计算机软件与理论)
导师: 刘宁
授予学位: 硕士
授予学位单位: 大连海事大学
学位年度: 2010
正文语种: 中文
检索历史
应用推荐