详情

当前位置：首页> 学位论文 >详情

原文传递基于强化学习的不同合乘意愿下出租车调度方法

论文题名：	基于强化学习的不同合乘意愿下出租车调度方法
关键词：	出租车调度;需求预测;LightGBM;合乘行为;A3C;出租车仿真
摘要：	随着城市居民生活水平提高，以出租车为代表的需求响应式公共交通逐渐成为了人们出行的主要选择之一。而现有的出租车调度方式中存在的调度模型搭建精度不足影响调度效果、需求响应式调度策略车辆运行滞后、乘客合乘出行时对乘客的合乘意愿考虑不足等问题。　　针对上述问题，本文进行了如下研究内容：首先，均衡预测时间以及预测效果后选择对出租车出行需求总量及其分布均有较好效果的LightGBM算法对下一时段即将产生的出租车需求数进行预测，便于提前对车辆进行调度，避免其滞后性。其次，基于六边形栅格矩阵，分别利用栅格矩阵内的预测需求数以及可调度的车辆数作为强化学习中的状态变量、利用栅格向周围栅格调度的出租车个数作为动作变量、利用调度区域内的出行需求乘客的平均等待时间与车辆调度平均距离，结合各项惩罚项作为奖励变量，基于A3C网络构建强化学习出租车调度模型。再次，考虑乘客的不同合乘意愿构建合乘模型，结合了出租车合乘条件、基于合乘结果的奖励函数、基于合乘价值的发生函数等，分别在强化学习模型中加入针对合乘行为的优化，以及在后续仿真验证过程中对合乘情况进行模拟，分析不同合乘意愿下对出租车调度策略的影响。最后，基于上述所构建车辆调度以及合乘模型，同时依托于实际出租车运行数据搭建仿真环境，对所提出调度策略进行了验证，并与按需调度方式进行对比。　　仿真实验结果显示，在针对不同的优化目标进行优化时，基于强化学习的调度策略可以有针对性地调整方案以提升策略在相应目标上的表现，平均奖励分数提升13%左右；当需求压力上升时，所提出的调度策略相比于按需调度产生的提升效果更加明显；当考虑合乘时，强化学习调度与按需调度均在乘客合乘意愿上升后于乘客平均等待时间目标上取得一定优化效果，而难以针对车辆调度距离进行相应改善，但前者在乘客平均等待时间目标上的提升效果优于按需调度，且随着合乘意愿越高，优化效果越明显。　　因此，本文所提出基于强化学习的考虑不同合乘意愿的出租车调度策略可以针对所验证的不同情况对传统调度方式做出优化，且在乘客合乘意愿上升时，能够得到更加的优化效果。该策略给出租车或网约车相关管理与调度提供了新的思路，同时为后续出租车调度问题的研究具有一定贡献。
作者：	吴海龙
专业：	交通运输工程
导师：	慈玉生
授予学位：	硕士
授予学位单位：	哈尔滨工业大学
学位年度：	2021

相关文献

检索历史

应用推荐