论文题名: | 基于机器学习的严重交通事故典型场景识别及影响因素研究 |
关键词: | 严重交通事故;事故场景;机器学习;关联分析;场景识别 |
摘要: | 严重道路交通事故(SevereRoadTrafficAccident)相较于一般道路交通事故会造成更多的人员伤亡与财产损失,是事故预防工作的重点。严重道路交通事故的分布特征、影响因素及发生机理,与道路交通事故总体相比存在明显差异。以往文献多以事故总体样本为研究对象,针对严重道路交通事故的专项研究较少。 论文以严重道路交通事故为研究对象,开展典型场景识别及影响因素挖掘分析等工作。收集了我国2011至2020年较大、重大及特大等级道路交通事故调查报告并从中提取信息,将事故特征变量分为驾驶人、车辆、道路环境、外界环境、驾驶行为、碰撞特征等类别。首先对事故特征进行描述性统计分析。从时空分布、人-车-路特征、碰撞特征等角度分析严重道路交通事故的分布特征,并与事故总体分布特征进行对比,分析两者异同;其次挖掘典型事故场景,运用随机森林算法对特征变量进行重要度排序,选择重要变量应用PAM聚类识别典型事故场景,其余变量则应用Apriori关联规则以完善场景细节;接着应用Apriori关联规则研究事故形态、涉事车辆数与特征变量间的关联关系;最后应用LightGBM等集成学习算法建立事故严重程度分类模型,应用可解释性的SHAP值分析方法与Apriori关联规则分析特征变量对事故严重程度的影响效应,提出进一步研究的方向及针对性的事故预防策略。 研究结果表明:(1)严重道路交通事故与道路交通事故总体在时间分布特征等方面存在明显差异。(2)通过聚类分析获得10个典型事故场景,包括非营运车辆事故场景4个,货运车辆事故场景5个,客运车辆事故场景1个。(3)获得了事故形态、涉事车辆数的影响因素,并得到一些以往未能发现的关联关系,如:严重道路交通事故中女性驾驶员占比很少,却与多车事故、碰撞固定物事故高度相关;道路施工区与多车事故之间存在重要的关联关系。(4)事故严重程度分类模型研究发现,与SVM、决策树等算法相比,基于LightGBM构建的分类模型AUC值为87.28%,具有更好的分类能力。SHAP值分析发现了一些重要的影响效应,如:驾龄、车辆类型等特征对事故严重程度的影响效应较大,砂石及土路面下重大事故的发生风险较高。研究进一步揭示了严重道路交通事故的特征与发生机理,为制定针对性的事故预防对策提供依据。 |
作者: | 李青 |
专业: | 交通运输工程 |
导师: | 朱彤 |
授予学位: | 硕士 |
授予学位单位: | 长安大学 |
学位年度: | 2022 |