论文题名: | 多因素影响下的车辆碰撞风险预测方法研究 |
关键词: | 道路交通安全;车辆碰撞预测;驾驶次任务;风险水平 |
摘要: | 2021 年,世卫组织启动了 2021-2030 年道路安全行动十年,旨在到 2030 年之前将道路交通伤亡人数降低至少50%。为了实现该目标,迫切需要做好车辆碰撞预测的研究,以帮助车辆更好地提前预警进而避免交通事故的发生。而车辆碰撞事故的发生受人、车、路和环境的影响,特别是以驾驶次任务为代表的驾驶行为。基于此,本文将在对驾驶次任务风险水平探讨的基础上,研究多因素影响作用下的车辆碰撞风险预测方法。论文的主要工作如下: (1)数据预处理。论文以100-CAR NDS数据集为研究对象,结合总体研究目标,构造了“次任务数据集”和“SCE数据集”两类数据集。对于“次任务数据集”,进行了数据的提取与合并、驾驶次任务的筛选与保留的数据预处理工作,获取集合正例(SCE)样本780个,负例(非SCE)样本4420个。对于“SCE数据集”,进行了异常行程剔除、缺省数据填充、加加速度的特征生成、归一化处理、样本数据的加窗处理与标注的数据预处理工作,获取正例样本(碰撞事件类) 1225个,负例(近碰撞事件类)样本16050个。 (2)驾驶次任务风险水平划分的研究。论文基于“次任务数据集”,利用卡方独立性检验和Cramer’s V系数,明确驾驶次任务与SCE事件的相关性;利用综合病例对照研究和Meta分析的方法来计算39项驾驶次任务的风险程度OR值及95%置信区间;利用K-均值聚类算法对所有显著性影响的驾驶次任务完成了聚类,进一步划分驾驶次任务为5类水平。 (3)碰撞风险预测方法研究。论文基于“SCE数据集”展开研究。首先,采用随机森林的特征选择法对于静态影响要素进行选择,采用核PCA的方法将11400维SCE时序数据降为20维,采用SMOTE过采样方法对不平衡降维数据进行处理。其次,论文考虑车辆运动学参数、车车关系等时间序列的数据,应用7类机器学习方法构建了车辆碰撞风险预测模型,得出Random Forest、AdaBoost、XGBoost三项模型较优的结论;在时间序列的基础上,引入驾驶次任务的风险水平划分和风险水平未划分的结果,利用上述三项模型构建车辆碰撞风险预测模型,结果显示引入驾驶次任务的风险水平划分结果后使得模型整体性能获得显著提升;在时间序列和驾驶次任务风险水平划分的基础上,引入了包含天气状况、照明条件等12项静态因素,利用上述三项模型构建多因素影响下车辆碰撞风险预测模型,发现相较于改进前的模型而言整体性能获得进一步提升,此中XGBoost模型综合性能表现更优。 |
作者: | 姜鹏 |
专业: | 交通运输 |
导师: | 郑黎黎 |
授予学位: | 硕士 |
授予学位单位: | 吉林大学 |
学位年度: | 2023 |