摘要: |
预测交通事故实时风险时,存在大量指标变量,导致数据难以采集,不仅不利于构建预测模型,且带来的过拟合问题会降低模型预测可靠性。为了减少预测指标数量,提升预测模型可用性,降低预测模型过拟合影响,构建具有可解释性的2种交通流稳定性系数以简化指标集,分别为纵向交通流稳定系数和横向交通流稳定系数。采集西安市G3001高速公路交通事故与交通流历史数据,选用支持向量机、随机森林、Logistic回归模型,分别构建高速公路交通事故实时风险预测模型。通过改进的GI指数评估交通流稳定性系数的显著性,以检验其有效性;通过指标集在训练与测试数据中的预测精度、AUC值差异评估交通流稳定性系数对降低预测模型过拟合的作用,并通过训练耗时评估模型的计算效率,以检验新方法的可靠性。研究结果表明:2种交通流稳定性系数对应的改进GI指数分别为0.952和0.922,显著大于其他受试指标,与交通事故实时风险显著相关。在3种预测模型中,包含2种交通流稳定性系数的简化指标集在训练和测试数据中的预测精度分别为91.1%和90.5%,与完整指标集相近。2种指标集在训练与测试数据中的平均预测精度差异分别为0.69%和4.87%;平均AUC值差异分别为1.61%和5.87%;平均训练时间下降了15.2%。交通流稳定性系数大幅提高了预测模型的可靠性,同时显著提升了模型的计算效率。 |