论文题名: | 基于逆向强化学习的集装箱堆场多贝位装船发箱智能决策 |
关键词: | 港口管理;集装箱;堆场装船发箱;智能决策;装卸效率 |
摘要: | 建设现代化综合交通体系是实现交通强国战略的重要支撑,作为交通运输网络的重要结点,集装箱港口应实现智能监管、智能决策与智能作业,不断提高集装箱装卸效率,增强自身竞争力为实现交通强国做贡献。堆场出口箱装船发箱与岸边装船作业相关联,直接影响集装箱船舶靠泊时间,开展堆场装船发箱智能优化决策,是提升集装箱港口竞争力的重要突破口之一。 论文以常见的顺岸式集装箱堆场为对象,以最小化装船时堆场翻箱次数和水平搬运车辆岸边等待时间为目标,研究集装箱堆场多贝位装船发箱决策问题,保障岸边装船作业连贯性和装船作业效率。主要工作有: (1)根据堆场装船发箱作业实际,确定堆场发箱、岸边装船约束。将堆场装船发箱决策过程分为两个决策阶段,首先进行堆场多贝位发箱顺序决策,基于此展开装船时堆场贝内翻箱决策。界定堆场多贝位装船发箱决策并分析其影响,为进一步研究堆场多贝位装船发箱决策问题奠定基础。 (2)在堆场装船发箱顺序已知时,构建基于马尔科夫决策过程的装船时堆场贝内翻箱模型。设计基于逆向强化学习的装船时堆场贝内翻箱算法,与提出的基于随机决策和基于规则决策的算法对比。算法验证发现,由于可挖掘应用专家翻箱方案中隐含决策经验,逆向强化学习算法限制连续翻箱次数的优势明显,求解时间因涉及多次循环而偏长,但在可接受范围。 (3)以堆场装船发箱顺序为决策变量,引入岸边装船作业不悬空约束,将装船时堆场贝内翻箱模型扩展为堆场多贝位装船发箱决策模型。将逆向强化学习算法作为子算法,整合基于深度优先搜索的堆场多贝位发箱顺序算法,设计深度优先搜索-逆向强化学习智能决策算法。算例分析表明,深度优先搜索-逆向强化学习智能决策算法可有效求解堆场多贝位装船发箱决策问题,在确定堆场多贝位装船发箱顺序的同时,制定较优的装船时堆场贝内翻箱方案。 |
作者: | 蔡梦蝶 |
专业: | 物流管理 |
导师: | 张艳伟 |
授予学位: | 硕士 |
授予学位单位: | 武汉理工大学 |
学位年度: | 2021 |