论文题名: | 基于数据驱动的铁路事故分析及预测 |
关键词: | 铁路事故;预测模型;机器学习;不确定数据;卷积神经网络 |
摘要: | 铁路作为关系国计民生的重要运输方式,在拉动国民经济增长、保障居民出行等方面,发挥着不可替代的作用。2015年发布的《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》中提出,预计“十三五”期间全国新建铁路不低于2.3万公里,总投资不低于2.8万亿元。随着铁路运营里程的不断增加,铁路安全问题也愈发受到重视。铁路安全涉及广泛、专业性强且繁琐复杂。随着铁路运输速度的提高和行车密度的增大,出现安全问题的可能性也随之升高。 铁路事故预测作为铁路安全研究中的重要问题,一直受到铁路运营管理部门和研究铁路运营的学者们的高度重视。铁路事故预测建立在铁路事故致因分析和铁路事故风险分析的基础上,根据已经发生的铁路事故和当前铁路环境对未来可能发生的趋势做出预测,是铁路安全研究的重中之重。基于铁路事故预测的研究现状,本文开展了如下工作: 一、选择基于数据驱动的方法对铁路事故预测进行研究。针对铁路事故数据中的不确定数据的问题,提出用机器学习中的支持向量机模型处理铁路数据中的包含不确定数据的数字数据,以改进的完全支持向量机作为预测方法,将真实铁路事故数据为训练数据,建立机器学习模型,在此基础上针对数字数据中的不确定数据进行改进,得到基于数据驱动的铁路事故数据预测结果,结果显示本文的改进方法可以让铁路事故预测准确率从67%提升到81%左右。 二、提出用机器学习方法中的深度学习作为工具处理铁路数据中的包含不确定数据的文本数据,以卷积神经网络作为预测方法,将美国联邦铁路管理局提供的数据作为训练数据,建立卷积神经网络预测模型,针对包含文本数据中的不确定数据进行改进,得到针对文本数据的铁路事故预测结果。结果表明,可以将预测准确率由改进前的71%提升到改进后的74%左右。 三、基于前文工作中的实际运算情况,运用计算机知识和开源数据处理工具,对整个运算工作流进行抽象,提出铁路数据高速处理框架。该框架使用ElasticSearch和Cassandra等现代非关系型数据库进行数据的安全存储和高速读写,利用面向对象语言实现模型与算法,并针对铁路数据特征进行优化,在数据读写速度数据计算速度和框架使用便捷性等方面,相较于其他交通领域内的数据处理框架都有较大提升,在性能上有30%以上的提升。 |
作者: | 王舒啸 |
专业: | 系统科学 |
导师: | 李克平 |
授予学位: | 硕士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2017 |
正文语种: | 中文 |