论文题名: | 基于报修文本的高速公路机电设备维护响应等级预测方法研究 |
关键词: | 高速公路;机电设备维护;响应等级预测;报修文本 |
摘要: | 随着人们生活水平不断提高,对于高速公路交通出行的安全性和舒适性也提出了更高的要求。为了保障人们更为安全、舒适的交通出行,我国加大了对各类高速公路机电设备报修维护方面的投入。高速公路机电设备报修维护响应等级直接决定了机电设备维护的响应时间和投入资源,对高速公路交通出行有着非常重要的影响。尽管我国高速公路机电设备报修维护积累了大量的报修维护文本与定级的经验数据,但是当前的机电设备报修维护响应等级主要依赖于人工划分。一方面,由于人工易出错,致使维护响应等级划分不统一而造成严重的后果,导致高速公路无法正常通行;另一方面,由于人工效率低,无法满足我国高速公路机电设备报修维护高效率的发展。因此,如何利用这些高速公路机电设备的报修文本,通过深度学习和自然语言处理技术实现高速公路机电设备维护响应等级的精准预测,成为了高速公路机电设备维护的关注重点。开展高速公路机电设备维护响应等级预测研究既能提升我国高速公路机电设备维护效率,也能为我国人民安全舒适的交通出行做出贡献。 在上述背景下,本文提出了基于报修文本的高速公路机电设备维护响应等级预测方法研究,论文主要的研究内容与方法包括以下几点: 1)提出了一种基于两步法的报修文本数据挖掘研究,实现对报修文本数据的定量内容分析,探索数据集的特征,打破了数据孤岛的局面。为了挖掘报修文本中的文本信息,并为后续研究构建一个可用数据集,我们需要与维修公司的工作人员开会讨论,理清各个词汇的含义,制定并划分各种高速公路机电设备故障的维护响应等级;然后,对报修文本进行文本预处理,并将处理后的数据构建成一个近 3 万条短文本的高速公路机电设备报修文本数据集HEEMR,弥补国内没有相关数据集的空白;最后对该数据集进行词频分析、共现网络分析和相关性分析,从而获得高速公路机电设备报修文本的关键词词表和常见的故障类型,这对高速公路的长期稳定运行和公共交通安全具有重要意义。 2)提出了一种基于关键词特征融合的KW_Fasttext维护响应等级预测方法,主要解决了工作人员对高速公路机电设备维护响应等级划分时间长、准确率低和响应不及时的问题。由于报修文本数据文本短、专业词汇多和故障涉及面广的特点,KW_Fasttext利用两步法分析后得到关键词列表与 N-Gram 模型生成的词表进行特征融合,弥补了短文本数据特征不足的缺点;经过融合后的特征平均化输入FastText模型中进行训练, FastText的应用解决了时效性差、速度慢的问题;最后,在HEEMR数据集上进行实验, KW_Fasttext对维护响应等级预测准确率为93.70%,比原FastText模型提高了2.94%,证明了该方法的有效性,满足行业需求。 3)提出了一种基于注意力机制 BiGRU 的维护响应等级预测方法,主要解决了KW_Fasttext 所存在的信息冗余问题,并提高了预测准确率、降低了运行时间。首先,该方法采用随机初始化输入,避免使用预训练好的大规模词向量,缩短了训练时间;其次,利用BiGRU模型,可以有效提取短文本特征,降低训练时间,解决时效性差的问题;然后,引入注意力机制,能够区别对待BiGRU网络的输出,从中挑选出重要的节点信息,而忽视部分价值不大的输出节点,从而改变各个特征词的权重,以达到更好的效果;最后,在HEEMR数据集和THUCNews数据集上进行实验,准确率分别为94.74%和89.73%,证明了该方法的有效性和泛化性。 |
作者: | 黎红志 |
专业: | 机械工程 |
导师: | 梅益 |
授予学位: | 硕士 |
授予学位单位: | 贵州大学 |
学位年度: | 2023 |