论文题名: | 案例文本驱动的铁路应急管理辅助决策系统的研究与开发 |
关键词: | 铁路案例分析文本;相似案例匹配;自然语言处理 |
摘要: | 铁路作为我国交通运输体系的中流砥柱,是国家重要的基础设施。运输安全是铁路运输的重要保证,近年来,随着国家铁路集团信息化的建设以及铁路运营管理的不断优化,虽国内铁路安全事件呈现下降趋势,但由自然灾害、事故灾难、公共卫生、社会安全四类铁路突发事件引发的铁路安全问题仍不容忽视。 铁路应急决策往往需要参考以往案例的经验知识与应急预案来协定当前突发事件的应急方案并进行实施,针对各类突发事件,铁路案例分析文本中详细地记录了事件过程、原因分析、采取措施及相关处置经验,经多年积累形成大量有价值的文本数据,但由于非结构化的铁路案例文本与缺少专业的文本数据处理人员,当前还比较缺少对历史案例文本的深入研究,导致大多数的铁路案例分析文本数据只能以文本形式描述和存储,没有进一步挖掘该数据背后的价值。针对以上问题,本文基于深度学习的自然语言处理技术深入挖掘案例分析文本数据背后的价值,对当前案例通过神经网络模型进行分类判定,在海量历史案例中迅速匹配出与当前目标案例相似度最高的同类别案例以达到辅助工作人员做出决策的目的。本文从铁路安全文本数据的视角,研究铁路针对突发事件的案例分析文本,基于CBR理论设计相似案例匹配流程,运用深度学习领域中的自然语言处理的理论与技术,对铁路案例文本进行案例表示,构建铁路案例文本分类模型与相似案例匹配方法。本文主要研究内容如下: 首先,对现有学者的研究成果进行系统分析,从铁路突发事件分类分级、铁路应急管理过程、铁路应急决策三个方面对当前我国铁路应急体系现状进行分析总结,多方搜集历年铁路案例分析文本并进行归纳与整理构建案例数据集。其次,对案例文本数据集展开分析,使用文本预处理方法对数据集中高频词汇,未分词案例分析文本的句子长度,分词后案例分析文本的句子长度进行分析,针对铁路案例分析文本中涉及铁路专业词汇多,领域广而导致常规分词工具效果较差的问题,结合多方电子词库资源与铁路专业词汇书籍,构建了包含十三个二级词库的《铁路电子词库》,为后续的神经网络模型超参数设置提供参考。 再次,本文基于深度学习的自然语言处理技术,使用BERT语言模型将案例分析文本转化为包含语义的数字化表示,构建铁路案例文本分类检索模型。在分类模型选定中通过对比实验探索BERT-BiLSTM、BERT-BiGRU、BERT-TextCNN、BERT-Transformer四种模型针对铁路案例文本的分类效果,得出BERT-BiGRU为最优模型并对其进行优化,通过实验证明得到了特征提取更优的BERT-BiGRU+BiLSTM分类模型。在相似案例的匹配算法中,在获取到当前突发事件现场状况信息缺失程度较高时,采用基于语义的相似案例匹配方法,通过相似案例微调训练后的SBERT模型生成案例文本向量后进行文本相似度匹配;当获取当前突发事件现场信息较为完整时,采用基于案例文本特征的相似案例匹配方法,之后通过实验验证了分类检索模型整体的有效性。 最后,在完成上述工作后,本文根据铁路当前应急决策的需求,对案例驱动的铁路应急管理辅助决策系统进行设计与实现,系统包含智能匹配辅助决策模块、综合业务模块与当前铁路突发事件管理模块。系统采用B/S架构,将训练好的神经网络部署到网页后端方便工作人员使用。 |
作者: | 赵正云 |
专业: | 交通运输工程 |
导师: | 崔炳谋;赵周 |
授予学位: | 硕士 |
授予学位单位: | 兰州交通大学 |
学位年度: | 2022 |