摘要: |
为探索中型城市居民出行特征以及不同因素对出行方式选择行为的影响机制,本文以中国某中型城市居民出行数据为例,综合考虑传统离散选择模型和机器学习模型在预测精度和建模合理性上的优劣,以及机器学习模型超参数求解算法的特点和效率,引入变异程序,提出粒子群优化随机森林的中型城市居民出行方式选择预测模型,采用预测准确率、出行方式比例预测绝对误差和期望模拟误差这3项性能指标,量化对比粒子群优化随机森林模型与多种机器学习模型和多项Logit模型统计学上的预测性能差异,利用SHAP(SHapley Additive exPlanation)模型深入分析个人社会经济属性、出行属性及出行方式属性等相关因素与居民出行方式选择之间的非线性关系。结果表明:粒子群优化随机森林模型整体平均预测准确率最高,为0.856,出行方式比例预测平均绝对误差和期望模拟平均误差最低,分别为0.062和0.306,模型间指标差异在统计学检验下显著;距离对不同出行方式选择的影响最显著,步行和私家车出行对距离敏感性更高,不同距离下,两者选择概率变化超过35%;30岁以下群体不同出行方式选择概率差距大于其他年龄段;性别、是否拥有私家车或公交IC卡等因素显著改变公交车和私家车的选择概率。 |