论文题名: | 基于强化学习的定制公交路径规划问题研究 |
关键词: | 定制公交;路径规划;强化学习;混合整数规划 |
摘要: | 随着城市化进程的加速和人口密度的不断提高,城市交通压力持续增大,传统的公共交通方式已经难以满足日益多样化的出行需求。为有效缓解交通拥堵和提高出行效率,定制公交逐渐成为一种可行的解决方案,它能够根据乘客的实际需求,提供更为便利和舒适的出行体验。本文从运营商的视角设计了一个基于强化学习仿真环境的两阶段求解方案。该方案聚焦于多对一场景下的定制公交路径规划问题,即乘客起点不同但目的地相同。并针对考虑乘客终点到达时间的定制公交路径规划问题展开研究,旨在设计一种有效的优化方法以满足乘客的出行需求,同时提高定制公交的运营效益。 首先,本文详细阐述了定制公交路径规划问题的背景和重要性,同时回顾了相关领域的研究现状。提出了一个两阶段优化模型,综合考虑了乘客价值、路程时间和定制公交运营成本。 在第一阶段,根据乘客的地理位置、下车终点、终点到达时间等信息将乘客划分为若干个子集作为预开通任务,通过使用K-means和DBSCAN聚类算法来实现。再将预开通任务带入强化学习仿真模拟环境对每项任务进行求解。在限定时间内仿真模拟环境能得到的最大奖励作为任务的求解结果。因此,在这一阶段得到了以最早上车乘客站点作为任务起点的最优路径,生成的任务信息还包含了接上的乘客信息,任务总服务时间,时间窗等。 在第二阶段,目标是解决一段时间内多个不同类型的定制公交车辆从各自车场出发,完成所有已生成任务并返回各自车场的调度问题。为实现此目标,利用Gurobi优化器建立了一个混合整数规划模型进行求解,最终得到整个定制公交运营系统的路径规划方案。 其次,本文比较了不同的强化学习基线算法在模拟环境中的表现,并对PPO基线算法加以改进,使用了卷积神经网络。通过使用虚拟乘客需求数据进行案例分析,验证了本研究提出的方法在解决定制公交路径优化问题方面的有效性和实用性。实验结果表明,所提方法能够在满足乘客终点到达时间约束的前提下,有力地减少运营开支,增进定制公交的运行效益。 综上,本文针对多对一场景下的定制公交路径优化问题,提出了一个基于强化学习的两阶段求解优化方法,为实际城市交通规划以及定制公交运营提供有益参考。 |
作者: | 蔡昊 |
专业: | 控制工程 |
导师: | 曾伟良;杨文臣 |
授予学位: | 硕士 |
授予学位单位: | 广东工业大学 |
学位年度: | 2023 |