论文题名: | 基于数据挖掘技术的交通状态判别算法研究与应用 |
关键词: | 数据挖掘;交通状态判别;集对分析;数据不均衡;随机森林 |
摘要: | 随着社会的发展,汽车保有量逐渐增加,交通需求量快速增长,现有的道路基础设施已经不能满足现在的交通需求。在城市道路中,市民上下班高峰期的车流量远大于城市道路通行能力,路网结构的不合理设计以及雨雪天气等都能造成交通拥堵。交通拥堵不仅增加车辆延误和市民出行时间,导致交通事故频发,还严重影响社会的可持续发展。采取必要的措施来治理交通拥堵是急需解决的问题,而准确的交通状态判别是缓解交通拥堵的重要前提。 论文在研究了数据挖掘技术经典算法和流程以后,针对城市道路交通流数据的特点以及交通状态判别的要求,首先对交通流数据进行预处理,删除无关属性,利用交通流理论剔除错误数据,并且根据实际需求改变了数据的时间粒度。 对预处理之后的数据进行分析,针对交通状态的不确定性,利用幂函数隶属度集对分析算法进行交通状态判别,其中三个参数权重的设定根据三个系数与交通状态的相关系数大小来确定。随机森林算法受数据不均衡问题的影响较小,所以初步利用随机森林算法对交通状态进行判别。 针对交通流数据的不均衡问题,采用欠采样以及过采样方法进行处理,并对处理后的数据分别利用集对分析与随机森林算法进行状态判别。在进行过采样时,用SMOTE进行了不同倍率下的过采样,以研究不同采样倍率对交通状态判别准确率的影响。最终结果表明,基于SMOTE过采样的随机森林算法可以有效解决数据不均衡问题。 针对原始不均衡数据、欠采样数据以及过采样数据,对集对分析与随机森林算法的优缺点进行了对比。欠采样方法丢失了原始数据集的隐含信息,对于本文来说并不可用。集对分析算法在运行效率上略优于随机森林算法,但是对于过采样之后的数据,随机森林算法可以显著提高少数类样本的判别准确率,明显优于集对分析算法。 最后对本文的工作进行了总结,并对下一步的研究工作进行了展望。 |
作者: | 刘英 |
专业: | 控制科学与工程 |
导师: | 高林 |
授予学位: | 硕士 |
授予学位单位: | 青岛科技大学 |
学位年度: | 2017 |
正文语种: | 中文 |