论文题名: | 面向FSA的船舶安全数据库设计及数据采集方法研究 |
关键词: | 船舶安全;数据库系统;网络爬虫;自定义词库;信息抽取 |
摘要: | 近年来,一系列油船泄露等海难事故的频繁发生,造成海洋的严重污染,国际海事组织为防止此类事故的发生,相继出台了一系列新标准对船舶安全进行评估。FSA是在工业风险管理基础上结合当前海运特征建立起来的一种评价体系,可帮助评估有关海上安全和海上环境保护的新规定。船舶安全数据作为评估现有安全水平和降低风险措施有效性的基础,在采用FSA方法进行风险分析时必不可少。 采用FSA方法在进行风险评估时需要有历史数据的支撑。然而,我国海事部门在最初积累资料构建船舶相关数据库时,不是以应用于风险评估为目的的,导致在利用现有船舶数据库进行风险评估时存在一些明显的限制。因此,需要有一个面向FSA方法的船舶安全数据库来为风险评估提供数据基础。本文具体研究工作如下。 (1)船舶安全数据库设计。通过对国内外现有的典型船舶相关数据库的数据结构的分析,在考虑FSA方法对数据的需求的基础上,完成对船舶安全数据库的设计,包括需求分析、概念设计、逻辑设计和物理设计。 (2)船舶安全数据采集。根据船舶安全数据库的数据结构,确定各数据表中字段内容的数据来源以及获取方式,采用基于Web的数据获取方法,对目标数据进行采集以及规范化处理,将采集得到的不同结构数据存储在本地。 (3)自由文本信息抽取。对采集得到的非结构化海事自由文本信息,确定自由文本中可挖掘的有用信息,将其定义为待抽取数据项,根据抽取目标的常用表达方式构建自定义的海事词库,用于中文分词和词性标注,再根据分词后的词性规律编写抽取规则,并利用该规则对自由文本进行信息抽取,最后通过实验对相关抽取结果进行验证与分析。 (4)船舶安全数据库系统实现。对数据库系统进行性能设计和功能设计,对采用不同方法获取得到的各类船舶安全数据进行规范化处理后,导入船舶安全数据库,最后,设计并实现对船舶安全数据的查询统计功能。 |
作者: | 余晨 |
专业: | 交通运输工程 |
导师: | 毛喆 |
授予学位: | 硕士 |
授予学位单位: | 武汉理工大学 |
学位年度: | 2017 |
正文语种: | 中文 |