摘要: |
为更精准利用收费OD数据获取路网时空交通运行参数,提出一种机器学习预测服务区驶入与收费OD数据增量迭代相结合的计算交通运行状态的方法。首先利用机器学习方法开展服务区驶入预测,通过调查获取23515份问卷数据,利用随机森林模型、支持向量机、朴素贝叶斯模型3种机器学习方法开展训练和预测精度敏感性分析,结果表明进入服务区最小概率阈值Pt存在最大峰值,当Pt为0.9左右时,总体预测结果精度最高,此外随机森林法在不同类别收费形式和车型中均表现出较为显著的精度优势。然后以短距离出行OD数据为初始值,推测基本路段行程时间,以距离阈值PF的倍数为时间隔,采用由近及远的方式增量计算路网运行状态,先前迭代计算的OD数据权重大于后续迭代的数据,对时空维度上缺失数据的路段状态进行补全。通过设计4组不同的PF值和3个对照组,在大规模省级真实路网环境下对算法有效性开展测试。对道路交通流量和行程速度的分析结果显示,采用随机森林模型,PF值越小误差越小,当PF=5km时误差最小,其中交通流量平均误差为5.46%,速度平均误差为9.84%。与近邻上下游插值法相比,所提方法计算交通流量平均精度提高3.98%,速度平均精度提高4.33%;与平均行程时间法相比,交通流量平均精度提高5.2%,速度平均精度提高5.87%。测试结果显示出较高的精度,表明所提方法具备较好的实用性。 |