摘要: |
数据挖掘是信息领域发展最快的技术,很多不同领域的专家,比如统计学家、数据库专家等,都从中获得了发展的空间,使得数据挖掘日益成为讨论的热门话题。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又有用的信息和知识的过程。是一个多学科交叉的研究领域,它融合了数据库技术、人工智能、机器学习、统计学、知识工程、面向对象方法、信息检索、高性能计算以及数据可视化等最新技术的研究成果,经过了十几年的研究,产生了许多新概念和新方法。
数据挖掘的算法很多,例如分类算法、聚类算法、时间序列算法、关联规则算法等等,本文主要研究的是聚类算法和时间序列算法。分别介绍了聚类算法和时间序列算法中一些典型算法的原理以及应用方法。
在智能交通方面,交通流数据的分析在是非常重要的,如何智能的分析交通数据一直以来是一个比较困难的问题,本文的核心内容有三部分,首先对数据进行必要的预处理,使之能够成为被数据挖掘算法直接使用的数据形式;其次利用k-means算法对收费站进行了聚类,并用SPSS Climentine11.1聚类算法对聚类结果进行了验证;最后利用Microsoft时间序列算法对交通流数据进行了预测,实验表明预测的准确率达到了80%以上。另外,在论文的最后对数据挖掘在交通方面的应用做出了总结及展望。 |