当前位置: 首页> 学位论文 >详情
原文传递 驾驶员事故频次分布及其影响因素分析
论文题名: 驾驶员事故频次分布及其影响因素分析
关键词: 道路交通安全;驾驶员;事故频次;零膨胀计数模型;机器学习;风险识别
摘要: 国内外道路交通安全形势严峻,人的因素是造成事故发生的一大重要原因。目前,交通事故的频次研究多是以“交通小区”、“行政区域”、“交叉口”等为单位来分析事故频次及影响因素,鲜有以驾驶员为单位对事故频次进行分析。据此,本文以发生负责任事故的小汽车驾驶员为研究对象,构建驾驶员事故频次的零膨胀计数模型,分析驾驶员事故频次的分布及其影响因素;基于SMOTE算法对非平衡数据进行处理,运用机器学习方法对驾驶员事故风险识别进行深入研究。研究结果可为利用历史违章数据对驾驶员进行事故预警提供科学依据。主要工作如下:
  (1)驾驶员事故频次分布规律。通过对原始事故数据进行清洗与融合处理,提取了21560个驾驶员的有效样本,运用基本统计分析的方法,分析事故频次的总体分布规律及不同属性特征下的频次分布差异。结果表明性别、年龄、驾龄、车辆品牌、驾驶员前一年的违规次数和违规类型以及首次事故类型等特征变量均对驾驶员事故频次有显著性影响。
  (2)基于零膨胀模型的驾驶员事故频次关键影响因素分析。利用驾驶员的特征变量与其事故频次数据,构建驾驶员事故频次的零膨胀模型,揭示其事故频次的关键影响因子。模型结果表明,前一年有严重违规或首次事故为故意违法类型的驾驶员,其一年内再次发生负责任事故的可能性更高;驾龄短、驾校考核不严、前一年违章次数多的驾驶员,其发生事故的频次越高。
  (3)基于非平衡数据的驾驶员事故风险识别。基于SMOTE算法对事故频次的非平衡数据进行处理,运用Logistic模型、SVM分类算法及CART分类树等方法,得出特征变量的重要性排序,并识别驾驶员全年是否会发生多次事故。结果表明驾驶员前一年违规次数、违规类型、驾龄及年龄等变量重要度最高,由此论证了基于历史违章数据对驾驶员进行事故预警的合理性;识别效果方面,SVM方法最优,其准确率达79%。
作者: 石宁宁
专业: 交通运输工程
导师: 杨小宝
授予学位: 硕士
授予学位单位: 北京交通大学
学位年度: 2018
正文语种: 中文
检索历史
应用推荐