论文题名: | 地铁深基坑施工风险主题挖掘与关联可视化方法研究 |
关键词: | 地铁工程;深基坑;施工风险;关联可视化;文本挖掘 |
摘要: | 二十一世纪以来,中国城市轨道交通基础设施建设力度持续加大,地铁车站深基坑施工安全事故频发,说明现场施工风险管理存在缺陷。目前大多数学者以监测数据、专家评分或仿真模拟等结构化数据开展施工风险研究,极少利用非结构化文本数据研究风险,工程实践积累的施工风险记录文本未被挖掘利用。因此,本文创新提出地铁深基坑施工风险主题挖掘与关联可视化方法,以工程项目实践收集的风险记录文本为基础数据,挖掘出隐含的风险主题和风险关联关系,绘制施工风险关联可视化网络图,以提高识别获取风险关联信息的效率,科学准确地指导施工中针对关键风险和关联风险采取预防控制措施,改进现场施工风险管理,是文本研究的出发点和重要目标。其主要研究内容有: 首先,提出研究问题,论述相关理论方法,梳理研究思路。从地铁施工背景和国内外相关研究现状分析,地铁深基坑施工风险管理存在不足,特别是绝大部分研究以结构化数据开展施工风险评估分析、大量积累的施工风险案例文本数据未被挖掘利用等问题。从研究问题出发,分析地铁深基坑施工风险管理理论、文本挖掘和可视化相关理论与方法,梳理论述本文研究思路和内容,为地铁深基坑施工风险主题挖掘与关联可视化方法研究奠定理论与方法基础。 其次,论述和试验地铁深基坑施工风险案例文本数据预处理过程。利用Python语言中的Jieba工具包对施工风险案例文本中文分词,补充用户自定义词典、停用词典优化改进分词效果,实现文本数据语料清洗和过滤;再利用向量空间模型(VSM)实现文本向量转化,引入TF-IDF算法赋权计算,保留高权重的施工风险特征词,实现文本数据降维和去噪处理;最后用样例试验展示文本数据预处理过程,为施工风险主题挖掘与关联可视化研究提供数据基础。 再次,进行地铁深基坑施工风险主题文本挖掘。构建基于LDA主题模型和K-means文本聚类的风险主题文本挖掘模型,从大量风险案例文本数据中挖掘出施工风险主题,实现大数据中的关键风险挖掘分析;采用半自动化方式分配风险记录标签,计算挖掘结果评价指标精确率、召回率和F值,分析施工风险主题挖掘的正确率超过90%,验证该模型的适用性和可行性,同时验证基础数据的科学性和挖掘结果的可靠性;进一步综合分析挖掘结果,得到30个施工风险主题,并梳理总结出各类风险应重点关注和排查的风险要点,以指导在地铁深基坑施工中采取针对性措施排查控制施工风险,保障现场施工安全。 最后,建立地铁深基坑施工风险关联可视化方法。先利用Apriori算法挖掘出施工风险关联规则,利用风险主题优化改进风险关联可视化网络图,从而高效直观地获取分析风险关联关系,针对风险关联规则前项采取措施预防和控制,有效降低风险关联规则后项发生的概率,改进现场施工风险管理;再利用社会网络分析法(SNA)探索分析风险与时间、空间的关联关系,利用风险主题优化改进风险关联可视化网络图,提高识别获取风险关联关系的效率和准确性,从而针对关联风险采取预防控制措施,有效改进现场施工风险管理。 本文开展地铁深基坑施工风险主题挖掘与关联可视化方法研究,实现LDA主题模型、K-means文本聚类、Apriori算法、社会网络分析法(SNA)及知识可视化等方法的集成应用和改进创新,从大量施工风险案例文本数据中挖掘出隐含的风险主题和风险关联关系,绘制风险关联可视化网络图,提高识别获取施工风险关联信息的效率和准确性,既验证本文提出的地铁深基坑施工风险主题挖掘与关联可视化方法的适用性和可行性,又能指导现场施工加强对关键风险、关联风险的预防控制,利用大数据分析结果补充完善现场安全管理,对地铁深基坑施工风险管理实践具有重要指导意义。 |
作者: | 亢显卫 |
专业: | 土木工程 |
导师: | 王乾坤 |
授予学位: | 硕士 |
授予学位单位: | 武汉理工大学 |
学位年度: | 2022 |