论文题名: | 无人机辅助卡车配送路径优化研究 |
关键词: | 车辆运输;无人机辅助;路径优化;深度强化学习;客户服务限制 |
摘要: | 随着物流行业的快速发展,车辆与无人机组合配送作为一种新型物流配送模式备受瞩目,与传统物流配送方式相比,该模式结合了两种运载工具的优势,具有更高的时效性与更低的配送成本,而想利用车辆与无人机组合配送模式实现物流的降本增效,关键之处在于提出合理高效的配送方案。因此,本文对无人机辅助卡车配送路径优化进行了研究。 本研究首先在无人机辅助卡车配送模式的基础上引入客户服务限制因素,将客户点划分为三种类型,并以运输成本最小为优化目标建立客户服务限制条件下的无人机辅助卡车配送路径优化数学模型。考虑到实际物流配送中的时变特性以及客户服务时间窗约束,采用基于车辆行驶速度变化的时间依赖函数来描述道路的时变特性,并且在目标函数中增加了时间窗惩罚成本,建立时变网络下考虑客户服务限制和时间窗的无人机辅助卡车配送路径优化数学模型。 其次根据问题特点设计了一种端到端深度强化学习求解框架用于求解无人机辅助卡车配送路径优化,该框架可以通过训练好的深度强化学习模型实现对问题的快速求解;在模型训练前将问题的求解建模为马尔可夫决策过程,并搭建由策略网络和价值网络组成的深度强化学习模型,利用带基准线的REIGNFORCE算法对深度强化学习模型进行训练,为了加速深度强化学习模型的训练根据问题特点设计节点屏蔽机制;模型训练过程中将问题中所有节点的信息通过策略网络中的编码器嵌入,并通过长短期记忆-门控循环单元(LSTM-GRU)组合网络融合注意力机制的解码器对编码器的嵌入信息进行解码;训练完成的策略网络模型即为问题的求解模型。 最后针对研究问题设计了不同规模的训练数据集和测试算例,并通过计算机编程进行了深度强化学习模型的训练和求解实验。实验结果表明,在模型训练方面,本文所设计的深度强化学习模型在收敛性上具有良好的表现,在收敛效果上优于现有的深度强化学习模型;在模型求解方面,分别与Gurobi求解器、变邻域搜索(VNS)算法和现有的深度强化学习模型相比,本文所设计的深度强化学习模型更加适用于研究问题的求解。通过设置不同的时变和时间窗参数进行对比实验,结果表明,针对时变网络下考虑客户服务限制和时间窗的无人机辅助卡车配送问题,合理安排卡车和无人机的出发时间,可以降低配送过程中的总成本;时间窗长度和时间窗惩罚成本系数与配送总成本之间存在一定的相关性。 |
作者: | 谷朋飞 |
专业: | 交通运输 |
导师: | 彭勇 |
授予学位: | 硕士 |
授予学位单位: | 重庆交通大学 |
学位年度: | 2023 |