论文题名: | 基于改进XGBoost算法的船舶事故风险及预警研究 |
关键词: | 船舶事故;XGBoost算法;风险预警;机器学习 |
摘要: | 保证船舶安全、预防发生事故一直是船舶运营中关注的重点。船舶事故具有独特性、复杂性、巨灾性的特点,以往的相关研究多采用定性分析或少量样本下定量分析的方法,如证据推理、模糊逻辑、马尔科夫链、贝叶斯网络等,模型可解释性和结果可靠性难以得到保证。随着计算机网络技术的发展,当前已进入数据大体量、多维度、高价值的大数据时代,各种机器学习算法凭借其处理数据能力强、结果可解释性高、不依赖现实假设等优点,已在多个与风险评估相关的领域中取得了显著成绩,更适合处理船舶风险预警研究中多种多量的风险因素。 首先,本文在收集到的现有数据基础上,逐一补充风、浪、雨、云等海洋气象特征。根据船舶安全问题的特点,建立了更具环境特色的船舶事故数据集。 其次,通过比较各种机器学习算法在数据集上试运行的结果,选择学习效果更好的XGBoost(极端梯度提升)算法继续求解。设计具有代价敏感的损失函数改进原算法,以解决试验数据集中样本类别不均衡的问题,并通过分层随机抽样和十折交叉验证的方法选择模型的一般参数。结果表明,改进后的模型AUC值(受试者工作特征曲线下方面积)和预测精度得到了明显提高,可达0.70和82%。与其它方法相比,该模型具有更高的可解释性,可以更好地揭示风险因素与船舶事故之间的作用关系。 接着,根据不同风险因素的模型贡献度得分,将风险因素划分为关键、重要和一般三个风险等级,其中载重吨、航线海域和船员数三个风险因素最为重要。通过对关键和重要风险因素进行灵敏度分析,以分析背后可能的原因来指导管理方向。 最后,以两艘船舶的两次不同航程为例进行情景分析(其样本数据不包含在训练集中),根据模型输出结果对高风险航段和易发生的事故类型进行预警。根据各类事故转换条件,为降低事故风险提出针对性的管理建议。 研究表明,本文的方法可以在大数据样本环境下更好地分析导致船舶事故的关键风险因素,为船舶提供风险预警,给航运企业、海事局等相关机构提供科学的决策参考。 |
作者: | 王文亮 |
专业: | 物流工程与管理 |
导师: | 王清斌 |
授予学位: | 硕士 |
授予学位单位: | 大连海事大学 |
学位年度: | 2022 |