论文题名: | 基于数据挖掘的道路交通事故分析研究 |
关键词: | 道路交通事故;数据挖掘;事故致因分析;组合预测模型;安全管理 |
摘要: | “十二五”时期,随着我国经济社会发展保持较高增长速度,城镇化深入发展,道路交通基础设施日益完善,机动车保有量、驾驶人数量和道路交通流量持续增长,道路交通在支撑和引导经济社会发展方面的作用越来越明显。随之而来,道路交通安全问题已日益发展成为事关人民生命财产安全、影响和制约经济社会发展质量效益的关键性问题,在国家安全战略高度得到了关注和重视。 道路交通事故是人、车、道路、环境等动静态因素耦合失调而导致的人或物同时受损的过程。道路交通事故历史数据可直接反映事故发生时人、车、道路、环境等因素间的作用关系。鉴于道路交通事故发生的多因素性、偶然性和模糊性等特征,对其进行分析研究一般以道路交通事故历史数据为研究对象,相关理论和方法的提出,旨在多角度、多层次的分析道路交通事故的影响因素,揭示出各类事故历史数据间相互关联作用的潜在规律与特征,有效辅助交通安全管理及事故防治。 数据挖掘技术是从大量数据中挖掘隐含的、未知的、对决策具有潜在价值的概念、规则、规律、模式的数据分析方法。把道路交通事故历史数据作为数据挖掘对象,对道路交通事故进行分析研究,重点和难点在于:一方面,事故历史数据多用于对“事故起数”、“受伤人数”、“死亡人数”和“财产损失”四项指标的描述性统计,其潜在信息价值未得到充分挖掘和反映;另一方面,事故历史数据的离散性、多维度和模糊因素集合等特征,以及信息采集过程中存在的完整性、客观性以及标准化等方面的问题,导致事故历史数据挖掘存在各种应用局限,进而直接影响传统数据分析理论与方法的应用效果。 本论文针对我国道路交通事故信息采集数据的特点及数据分析应用中的关键问题,从事故严重程度分析、事故预测和事故致因分析三个方面,运用分类、回归、聚类分析、关联规则挖掘等数据挖掘相关理论与方法,构建基于数据挖掘的道路交通事故分析体系,深入探究道路交通事故与人、车、道路、环境等要素的作用关系。取得如下主要研究成果: (1)以道路交通事故信息采集数据为研究对象,采用数据挖掘相关理论和方法,构建道路交通事故分析体系,为揭示交通事故影响因素及作用规律、预测事故发展趋势、改善事故预防机制和提高道路交通系统安全水平提供数据基础和理论依据。 (2)在对道路交通事故的人、车、道路、环境等背景因素分布特征与影响机理充分认识的基础上,比较研究各国道路交通事故信息采集技术和数据特征的异同,重点分析我国现行道路交通事故信息采集领域,特别是事故信息数据结构的现状和特点,为执行数据挖掘准备奠定了基础。 (3)引入数据挖掘理论的分类思想进行事故严重程度分析研究,按照二分类和多分类方法分别构建线性和非线性事故严重程度TPMSVM分类模型。同时,建立基于特征选择的事故严重程度背景因素分析方法,依据各特征变量对模型分类效果贡献程度的重要性排序,挖掘得到影响事故严重程度的核心特征变量。在实证研究环节,通过特征选择、参数寻优算法,分别获得交叉验证条件下的线性和非线性分类最优精度和特征变量重要度排序。 (4)提出基于ARIMA和SVR的时间序列组合预测模型,实现对事故四项指标的时点预测。同时,为获取道路交通事故的总体变化趋势和变化空间的预测信息,进一步研究基于信息粒化SVR的趋势预测模型,通过构造三角模糊粒子并通过SVR模型实现了对事故四项指标序列的趋势和范围预测,并进行实证研究。 (5)基于道路交通事故的微观特征分布进行事故致因分析,分别构建基于两步BIRCH算法的严重事故特征聚类分析模型和基于决策树的事故原因识别模型,实现对道路交通事故致因分析的微观挖掘。 |
作者: | 孙轶轩 |
专业: | 交通运输规划与管理 |
导师: | 邵春福 |
授予学位: | 博士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2014 |
正文语种: | 中文 |