当前位置: 首页> 学位论文 >详情
原文传递 基于神经网络的中国道路交通伤害预测模型研究
论文题名: 基于神经网络的中国道路交通伤害预测模型研究
关键词: 道路交通伤害;预测模型;回归分析;时间序列;神经网络
摘要: 研究背景:
  道路交通伤害已经成为全球不容忽视的重要公共卫生问题和社会发展急需解决的重大战略问题。根据世界卫生组织最新发布的《道路安全全球现状报告2018》,道路交通伤害已成为全球第八大死亡原因、5-29岁人群的首要死亡原因,每年约有135万人死于道路交通事故,2000万至5000万人受到非致命伤害,其中绝大多数道路交通死亡发生在发展中国家。作为世界上最大的发展中国家,随着公路网络建设的日趋完善,私家车保有量的快速增长,机动化水平的不断提高,中国的道路交通安全面临着巨大的挑战。我国的道路交通死亡主要发生在承担社会主要生产力的16-45岁劳动人群中,这对我国经济和人力资本的发展潜力造成了严重影响。与发达国家相比,我国道路交通事故数、死亡人数、受伤人数和经济损失依旧居高不下,存在着道路交通安全设施薄弱、道路使用者交通安全意识欠缺、管理手段落后等问题。为了实现全球和国家道路安全目标,我国必须对道路交通伤害给予足够的关注和重视,同时,采取一定的措施和策略来改善道路交通安全形势,推动道路交通安全不断发展。
  研究目的:
  1.了解我国当前道路交通伤害的流行特征;
  2.传统道路交通伤害预测方法的应用;
  3.不同神经网络模型在道路交通伤害预测方面的实践与应用;
  4.综合比较各种预测方法,为道路交通伤害预测模型选择提供科学依据。
  研究方法:
  1.根据公安部数据,对于2019年中国道路交通伤害情况进行描述分析,从时间、地区、事故原因形态、伤亡人员分布、道路情况等特征着手,明确我国2019年道路交通伤害的流行趋势和内在规律。
  2.以2000-2018年的中国月度道路交通事故数、死亡人数和受伤人数的数据为样本数据,分别运用回归分析预测法、时间序列预测法、BP神经网络法(BackPropagationNeuralNetwork,BPNN)和Elman神经网络法(ElmanRecurrentNeuralNetwork,ERNN)建立模型,对2019年月度道路交通伤害情况进行预测。
  3.比较分析本文建立的不同道路交通伤害模型预测精度,探索不同模型的应用范围和适用场景。
  研究结果:
  1.对2019年道路交通伤害情况分析发现:道路交通伤害多发生于白天,不同季节和不同月份的道路交通事故数明显不同,工作日的道路交通伤害情况明显较周末严重。事故数最多的省份是湖北,其次是广东和广西;死亡人数最多的省份是广东,其次是湖北和广西;受伤人数最多的省份是湖北,其次是广西和广东。上海的事故死亡比最高,达0.99,其次是河北、辽宁、甘肃、云南。2019年83.24%的事故主要原因为“机动车违法”;在“机动车违法”所致道路交通事故中,“酒后驾驶”占比高达9.41%;事故主要是车辆间事故,占比为70.16%。在事故伤亡人员中,48%的人年龄在21-55岁;事故伤亡人员主要是男性,占比70.13%;事故伤亡人员主要为农业户口。道路交通事故主要发生在平原地形,占总事故数的69.05%;事故主要发生于平直道路(81.49%);多数事故发生在机动车道(62.01%);道路交通事故多发生于二级公路上,高速公路事故死亡比最高。
  2.以2000-2018年道路交通伤害数据作为样本,分别建立事故数回归模型y=0.009x3?1.438x2?318.855x+64422.785、死亡人数回归模型y=0.002x3?0.714x2+33.064x+8235.751、受伤人数回归模型y=0.016x3?4.854x2+236.579x+39038.028;3个回归模型的决定系数分别为0.900、0.774、0.884。对2019年月度道路交通伤害情况进行预测,事故数、死亡人数、受伤人数回归分析模型的预测平均绝对百分比误差(MeanAbsolutePercentageError,MAPE)分别为38.71%、28.94%、36.25%。
  3.以同样的数据,利用时间序列分析法中季节性自回归滑动平均混合模型(SeasonalAutoregressiveIntegratedMovingAverageModel,SARIMA)进行建模,在比较多个备选模型之后,确定事故数、死亡人数、受伤人数的SARIMA模型分别为SARIMA(0,1,2)(0,1,1)12、SARIMA(2,1,2)(2,1,2)12、SARIMA(0,1,1)(0,1,1)12,模型回代拟合的MAPE分别为5.22%、4.88%、5.29%。对2019年月度道路交通伤害情况进行预测,实际值均落在预测值得95%CI范围内,事故数、死亡人数、受伤人数的预测误差MAPE分别为19.96%、5.05%、15.08%。
  4.运用BP神经网络对于道路交通事故数、死亡人数和受伤人数分别建模,其最佳模型结构为3-15-1,3-12-1,3-6-1;在对不同激活函数进行比较后,选用tansig函数作为隐含层激活函数,输出层选用pureline函数;比较几种常见训练函数后,选择trainscg函数;事故数、死亡人数、受伤人数BP神经网络模型的预测MAPE分别为9.03%、4.84%、6.69%;平均绝对误差(MeanAbsoluteError,MAE)分别为1840.67、254.42、1422.08;均方根误差(RootMeanSquareError,RMSE)分别为2415.79、304.73、1768.03。
  5.运用Elman神经网络对于道路交通事故数、死亡人数和受伤人数分别建模,其最佳模型结构为3-8-1,3-5-1,3-12-1;与BP神经网络类似,在对不同激活函数进行比较后,选用tansig函数作为隐含层激活函数;在比较了几种常见的训练函数后,选择了表现最佳的网络训练函数traingd;最终事故数、死亡数、受伤人数Elman神经网络模型的预测MAPE分别为7.47%、3.89%、6.61%;MAE为1566.17、205.08、1383.08;RMSE分别为2223.22、260.87、1976.29。
  6.比较不同结构的神经网络模型的预测精度,BP神经网络模型和Elman神经网络模型均在Net4(使用前三年同月的交通伤害数据预测下一年同月数据)有着最佳预测精度,尤其是死亡人数的神经网络模型,两个神经网络模型的MAPE均低于5%。
  7.对4种不同模型的预测结果进行了综合比较,Elman神经网络模型具有最好的预测精度,其次是BP神经网络模型,再者是SARIMA模型,回归分析模型的拟合效果则不太理想。
  研究结论:
  1.2019年我国道路交通伤害情况依旧严峻,仍然是重大的公共卫生问题。
  2.基于2000-2019年中国月度道路交通伤害数据建立的4种预测模型,事故数、死亡人数、受伤人数模型的预测精度均是Elman神经网络模型>BP神经网络模型>SARIMA模型>回归分析模型。
  3.对于不同预测方法的选择,可根据样本量、数据规律性、季节性等进行考虑。当样本数据量较大、规律性较强时可采用回归分析法;当数据存在明显季节性,且数据量较大时可采用SARIMA模型和神经网络法;当数据存在明显季节性但样本数据量较小时,可采用神经网络法,其中Elman神经网络的表现更佳。
作者: 钱依宁
专业: 公共卫生与预防医学;流行病与卫生统计学
导师: 张徐军
授予学位: 硕士
授予学位单位: 东南大学
学位年度: 2020
检索历史
应用推荐