摘要: |
本文旨在探究不同尺度数据集对高速公路实时事故风险建模的影响,并实现不同数据特征路段间事故风险模型的空间移植。首先,提取不同特征路段检测器信息,以动态交通流匹配事故数据构建多尺度数据集:高精度数据集、小样本数据集、低精度数据集以及同尺度条件下(同为高精度大样本量)的空间差异数据集;进而,通过贝叶斯Logistic回归量化不同样本量对事故风险模型预测性能的影响;分别采用统计学和机器学习手段建模分析高精度和低精度数据集;最后,基于贝叶斯更新方法建立实时事故风险移植模型,对高速公路实时事故风险预测模型进行空间移植,并验证其可靠性。结果显示:贝叶斯Logistic回归的性能随着样本量增大而有所提升;高精度数据条件下,贝叶斯Logistic回归和RF-SVM(Random Forest-Support Vector Machine)模型的AUC(Area Under Curve)值比低精度条件下分别高出0.092和0.037;在不同数据精度的空间移植中,贝叶斯更新方法可令低精度路段模型的AUC值从0.645提至0.714,在相同数据尺度的空间移植中,该方法可将被更新路段模型的AUC值从0.737提至0.751。结论表明:高样本量路段的模型虽然具备较高的分类准确度,但无法稳定地提升模型的预测性能,而高精度数据路段的模型可获得更高的分类准确度和预测精度;统计学方法在模型解释层面更具优势,机器学习手段在低精度数据路段下的预测性能更好;贝叶斯更新模型能够在一定程度提升空间移植效果。 |