当前位置: 首页> 学位论文 >详情
原文传递 基于深度强化学习的海运集装箱舱位动态定价研究
论文题名: 基于深度强化学习的海运集装箱舱位动态定价研究
关键词: 海运集装箱舱位;动态定价;Q-learning算法;Q(λ)算法;DQN算法
摘要: 集装箱班轮运输的市场复杂多变,在瞬息万变的市场需求下对集装箱舱位运价进行合理决策是班轮公司实现多种不同业务目标的有效工具。但不同于在传统航空业中动态定价方法的应用,集装箱班轮运输市场体现出需求难预测、多维度等特点,这对班轮公司提出了新的挑战。为应对难以预测的复杂市场需求,近年一些班轮公司推出了舱位在线预定系统,这使得对于市场的数据收集更加完整,也使在集装箱班轮运输业中应用动态定价的方法成为了可能。如何合理利用在线预定系统带来的庞大市场数据,应对难以准确预测的复杂市场环境,制定科学的集装箱舱位动态定价策略,已经成为备受关注的研究重点。因此,本文从班轮公司的角度出发,结合强化学习和深度学习对集装箱班轮舱位定价问题进行研究。
  首先,本文以班轮公司收益最大为目标,对现货市场中需求-价格函数分布未知的动态定价提出了合理假设,并在此基础上建立了动态规划模型和确定性模型。其次,分析了传统模型在该问题下的局限性,结合实际问题的特点建立了马尔可夫决策过程模型,并设计了基于Q-learning的动态定价算法对该问题求解。再次,为了解决Q-learning算法在高维状态-动作空间下的学习困难等问题,设计了基于Q(λ)和DQN的两种动态定价算法。最后,设计了两种规模不同的算例,讨论了不同动作维度下三种算法的求解效果,验证了强化学习算法在集装箱舱位动态定价应用的可行性与深度强化学习算法在集装箱班轮运输市场下优先的收敛速度和求解性能,进一步说明了本文所提出算法对班轮公司定价决策有参考意义。
  通过实验结果分析可知,本文针对集装箱班轮舱位动态定价的DQN算法具有现实意义;相比于基于经典强化学习算法的舱位动态定价算法而言,基于深度强化学习的舱位动态定价算法能进一步提高算法收敛速度,减少内存损耗;本文提出动态定价算法不仅具有较好的收益表现,并且能应对难以预测的市场需求环境。
作者: 谢子轶
专业: 交通运输工程
导师: 杨永志
授予学位: 硕士
授予学位单位: 大连海事大学
学位年度: 2022
检索历史
应用推荐