论文题名: | 地铁运营安全事故知识图谱的构建及分析 |
关键词: | 地铁运营;知识图谱;安全事故;异构网络;复杂网络 |
摘要: | 地铁作为主要公共交通工具之一,为繁重的路面交通减轻负担。地铁在解决城市拥堵问题同时,也随之带来难以预料的事故。目前,事故研究中大多仅对某类事故进行特定分析,或使用传统指标对事故模型进行分析,可能会忽视各类危险之间潜在的关联。此外,各式媒体平台快速发展,事故相关数据在种类和总量方面均大幅度提升,对数据抽取和分析提出更高的要求:如何保证信息抽取的准确性和客观性。所以,本研究拟借助知识图谱这一新兴网络工具,在较为全面、系统的角度下实现对安全事故的分析。同时为保证事故要素实体抽取的客观性和准确性,采用目前主流的信息抽取技术完成事故信息的抽取以实现地铁运营安全事故知识图谱的构建,最后,引入适应地铁运营安全事故知识图谱此类异构网络特征的分析指标对模型进行探索分析。在理论意义上实现对同构网络分析建模的拓展,挖掘节点之间更多潜在关联;在实践方面为地铁运营风险预防措施的制定提供更多的参考依据。 (1)作者通过查阅国内外文献,总结出目前危险因素表现形式和事故分析方法,同时阐述知识图谱在地铁运营安全管理领域的研究现状和发展趋势,指出目前基于知识图谱这类异构网络的计算分析较少。在此基础上,介绍了知识图谱信息抽取技术的发展情况,确定了借助知识图谱作为安全事故分析工具,构建地铁运营安全事故知识图谱此类异构网络,并引入改进的指标进行网络分析。 (2)基于系统分析方法,对地铁运营安全事故形成机理、事故类型和特征进行分析;同时,本研究对知识图谱组成要素、构建流程、应用优势进行概述分析。在上述分析的基础上,确定用5类要素实体:危险因素、危险频率、危险类型和事故后果、事故类型,通过先验知识划定3类实体关系:因果关系(Cause-Effect)、类属关系(TypeIs)和关联关系(HasValueof)实现对地铁安全事故在知识图谱中的可视化展示,提出以知识元作为事故要素实体的载体完成地铁运营安全事故知识图谱模式层构建,为知识图谱数据层的构建奠定理论基础。 (3)根据安全事故图谱的模式层,对所需实体(危险因素、事故涉及地点和人员)展开抽取工作。运用python完成收集数据的文本预处理,分别加载BERT模型、BERT-CRF模型、BERT-BILSTM-CRF模型在相同实验环境中进行模型训练学习,最后完成所需实体抽取,得出BERT-BILSTM-CRF模型的综合抽取效果相较于前两种模型更优,其F1值为90.76%最高,达到预期值。最终,通过实体抽取获得了59个危险因素实体,并利用事故涉及地点和人员实体辅助完成危险类型的判定。 (4)为实现因果关系的抽取,本研究人工构建5种因果规则模板,来完成因果句式的抽取,并通过依存句法分析对因果句式完成事件三元组的抽取,实现因果关系的抽取。经过人工校核,最终得到的危险因素之间、危险因素与事故后果之间共180条因果关系。因果关系抽取平均效果达到80.6%,总体效果良好。基于模式层的理论上,引入三个矩阵(因果关系矩阵、类属矩阵和值矩阵)将抽取的5类实体和3类关系按照关系类型逐步映射到netwokx中存储,成功构建地铁运营安全事故知识图谱数据层,为知识图谱此类异构网络的分析提供有力的数据支持。 (5)基于地铁运营安全事故知识图谱的网络特征,引入因果主动接近度和因果被动接近度、危险直接可达性和危险直接来源性、局部连通性和全局连通性、中介风险和累积中介风险分布4个改进性指标对地铁运营安全事故知识图谱进行网络分析获取8个关键因素及其特征属性。同时,为保证引入指标的合理性和有效性,本研究对仅基于cause-effect关系的事故-致因网络利用4个复杂网络拓扑指标(度与度分布、路径平均长度、聚类系数和介数)进行网络分析得到8个关键因素及其特征属性,与知识图谱分析得到的结果进行对比。结果表明,在知识图谱更为系统、全面的展示角度下,可以成功挖掘到因素之间更多潜在的关联,为地铁运营安全风险预防措施的制定提供更多的参考依据。 |
作者: | 罗丽 |
专业: | 建筑与土木工程 |
导师: | 邓勇亮 |
授予学位: | 硕士 |
授予学位单位: | 中国矿业大学(江苏) |
学位年度: | 2022 |