论文题名: | 高速公路交通事故持续时间预测研究 |
关键词: | 高速公路;交通事故;持续时间预测;决策树;随机森林 |
摘要: | 近几年来,我国高速公路进入快速发展时期,交通事故发生率逐年上升,事故的频频发生给人们的生产、生活造成了极大的危害。准确的交通事故持续时间预测有利于对事故进行合理地处置,减轻事故影响,避免二次事故发生。本文主要研究内容如下: 首先,本文对交通事故与持续时间定义进行阐述,以实际数据对高速公路交通事故的时空分布、类型及严重程度特征进行分析。在特征分析的基础上采用时间-状态分析法对高速公路事故发现、响应、清除和交通恢复阶段的演化过程进行研究,时间轴主要划分为事故发生、发现并确认、救援到达、事故清除、交通恢复正常这五个时间节点,状态轴主要针对人、车、路的状态进行研究。把握高速公路交通事故各个阶段的内在规律,分析事故发生后每个阶段演化过程影响因素,为事故持续时间预测提供理论依据。 其次,构建基于C4.5算法为核心的决策树高速公路交通事故持续时间预测模型。对事故持续时间正态性检验以及事故影响因素显著性分析,选取十个显著影响因素进行赋值,即事故类型、占用车道数、伤亡人数、事故车辆数、涉及大车数、事故车辆类型、事故发生时间、是否存在抛洒物、是否设施损坏、事故路段,并将事故持续时间以15min为区间进行离散化处理。将事故类型分为侧翻、失火、追尾、碰撞、擦挂、故障和货物散落,按照事故类型分别构建决策树预测模型并作出分析。 再次,构建传统的随机森林预测模型和基于加权随机森林的事故持续时间预测模型。使用单棵决策树性能评估值对决策树进行加权,引入事故影响因素特征与事故持续时间分类标签,计算每一棵决策树事故样本中事故影响因素特征与事故持续时间分类标签的相关系数、卡方和互信息,以此衡量决策树预测性能,使得每一个决策树预测模型在决策过程中占有不同权重的投票分量,作为决策树的权重实现对随机森林投票过程改进。 最后,本文运用所构建的基于决策树预测模型、基于传统随机森林预测模型和基于加权随机森林预测模型对事故持续时间进行预测,并做出比较。决策树预测模型中,使用混淆矩阵验证预测精度,预测精度较高的事故类型为侧翻和擦挂,分别为81.85%和81.20%,使用检验集和十折交叉验证判断预测模型的精度,分别为74.28%和72.68%;传统随机森林预测模型准确率最大值为75.07%;加权随机森林预测模型中三种投票加权方式预测准确率最大值分别为Chi-square=83.97%,Cor-coefficient=83.99%,Mut-Info=83.69%,且使用相关系数进行加权其准确率和稳定性最好。因此引入事故影响因素特征与事故持续时间分类标签的统计学特征值进行加权的方式是可靠的,显著提高了事故持续时间的预测能力及稳定性。 |
作者: | 傅洁 |
专业: | 交通运输工程 |
导师: | 向红艳 |
授予学位: | 硕士 |
授予学位单位: | 重庆交通大学 |
学位年度: | 2022 |