论文题名: | 基于数据挖掘的车辆类型识别的研究 |
关键词: | 数据挖掘;车辆类型识别;聚类分析;分类树;随机森林 |
摘要: | 数据挖掘是近些年来在信息技术领域兴起的一个比较重要的研究领域。在交通领域,众多车辆的大量原始数据的价值在于其中可能隐藏着大量未知的信息,而这些信息可以给人们提供更多帮助。数据采集技术迅速发展的同时,数据量也越来越大,属性特征也越来越多,如何在这些数据中获得有效有用的的信息正是数据挖掘所要解决的问题。 近年来,随着社会科学技术和世界经济迅速发展,交通事业作为关系着人们日常生活的重要领域,已经成为人们关注的焦点之一。在车辆数目急剧增长的今天,如何更好的通过所拥有的信息去了解各种车辆的情况,进行自动监测,如何对某特定时间和地点的车辆进行识别和分类,并以此作为交通管理、收费、调度、统计的依据,快速做到交通控制是亟待解决的问题。针对上述问题,本文分析了车辆类型分类的重要性及其传统人工分类的不足,并提出了应用数据挖掘方法对车辆分类的的识别,对交通行业、管理行业都有着实用价值。 本论文旨在针对所掌握的数据,利用分类的方法进行建模和预测。首先本文介绍了几种所用到的数据挖掘方法及其所建的各个模型的特点,然后将其运用到车辆识别中判断它们的识别能力并进行了比较分析。其中通过主成分分析和判别分析方法得出四分类中bus和van这两类,在训练集和测试集上的识别都挺高的(纯度高),所以将四分类转为了二分类,重点处理欧宝(opel)类和撒博(saab)类。之后对原始数据进行了处理,最后比较了各个模型得出的结果。 |
作者: | 杨越越 |
专业: | 概率论与数理统计 |
导师: | 许青松 |
授予学位: | 硕士 |
授予学位单位: | 中南大学 |
学位年度: | 2012 |
正文语种: | 中文 |