题名: |
基于可解释机器学习框架的列车乘车区段客流分布预测方法 |
作者: |
孙国锋
1
景云
1,2
李和壁
3
田志强
4,5
田小鹏
4 |
作者单位: |
1. 北京交通大学交通运输学院2. 北京交通大学智慧高速铁路系统前沿科学中心3. 中国铁道科学研究院集团有限公司,铁道科学技术研究发展中心4. 兰州交通大学交通运输学院5. 兰州交通大学高原铁路运输智慧管控铁路行业重点实验室 |
关键词: |
铁路运输;客流分布预测;可解释机器学习;列车乘车区段;非线性关系; |
摘要: |
为解释客运产品特征对列车乘车区段客流分布预测的影响,本文提出一种基于可解释机器学习框架的高速铁路列车乘车区段客流分布预测方法。首先,提出基于梯度提升树模型的高速铁路列车乘车区段客流分布预测框架,构建不同梯度提升树模型(GBDT、XGBoost、LightGBM及CatBoost)的高速铁路列车乘车区段客流分布预测模型;其次,计算特征贡献重要度,基于SHAP(SHapley Additive exPlanations)方法实现特征变量优化,揭示单一特征和交互特征与列车乘车区段客流分布预测的非线性关系。北京南—上海虹桥间列车客流分布预测结果表明:4种模型可精准预测客流分布结果,GBDT,XGBoost,LightGBM及CatBoost在测试集的决定系数分别为0.9664,0.9601,0.9680及0.9715;特征优化后,按贡献重要度排序依次为标杆车,票价,旅行时间,日期,星期,车次及出发时间;特征优化后,CatBoost-7模型在验证集中的决定系数为0.9458;日期和标杆车对客流分布预测呈现非线性正相关,旅行时间对客流分布预测呈现非线性负相关,低旅行时间、高票价及出发时间整点的标杆车对客流分布预测产生正向影响。本文研究结果能够为高速铁路客运产品设计提供一定参考价值。 |
期刊名称: |
交通运输系统工程与信息 |
出版日期: |
202403 |
出版年: |
2024 |
期: |
14 |